近年来,我国城市轨道交通行业发展迅猛,运营里程超过7 000 km,已建及在建线路达上百条[1-3]。从行业发展角度分析,城市轨道交通工程项目的若干统计数据应具有重要的研究价值。通过采用数据统计等方法对工程数据的基本特征进行分析,有助于全方位了解我国城市轨道交通工程建设领域的内在规律与变化趋势,为行业发展提供指导。1常用统计分析方法与分布常用的数据分析方法有描述性统计分析、参数估计、假设检验、方差分析、回归分析等。描述性统计分析是一种基础而有效的手段,可将一系列复杂的数据减少到几个能起到描述作用的关键数字,是对已有数据样本的整体情况描述,并体现数据的集中趋势、离散程度、分布形态。针对数据进行描述统计的分布形态较多,主要有正态分布、均匀分布、幂律分布、二项分布、指数分布等,在城市轨道交通若干专业领域的数据分析中已得到应用与体现[4-8],但针对行业总体数据分析的研究与应用较少。原因是行业总体数据庞杂且难于收集,未经整理的原始数据一般不易体现明显规律。应在结合已初步构建起来的轨道交通工程多样本数据库[9]的前提下,选择适合且便捷的数据统计分析方法开展相关工作,这也是亟待解决的问题之一。2正态分布基本特征在统计学领域里,正态分布是一项重要的分布形态。当随机变量X服从一个数学期望为μ、标准差为σ的正态分布,可记为[μ,σ]。双参数决定性:若一组样本数据被证实符合正态分布特征,其概率密度函数由μ决定分布的位置,由σ决定分布的幅度。特征值推断性:工程样本选取合理且数量足够时,样本的正态分布特征,可以反映行业总体的正态分布特征。统计学基础性:正态分布是许多统计方法的前提,如假设检验、方差分析、回归分析等,均要求分析数据服从正态分布。上述正态分布的基本特征,有利于工程数据的快速整理与标准化,描述简洁,合理划分,并可通过样本推断总体,也有助于轨道交通领域相关专业进行深入的数据分析。3主要研究对象城市轨道交通工程所涉及的专业众多[10],统计数据类型繁多、数据量庞杂,按照其主要性质进行分类。规模类:线路长度、车站数量、车站建筑面积、车辆基地建筑面积、主变电所数量、控制中心数量、建设用地及征地拆迁面积等。经济类:总概算、技术经济指标、工程费、建设费、设备费、安装费、其他费用、预备费、专项费等。技术类:各专业技术参数,如客流预测、行车组织、车辆制式、速度制式、供电制式、信号制式以及空调制式等。工程技术类统计数据一般由各专业设计需求决定,在不同轨道交通项目中具有一定的共通性。本文选择前两类相对独立且有一定代表性的工程样本统计数据作为研究对象,对其正态分布特征进行验证与分析,研究其内在规律。4统计数据正态分布特征4.1时序散点分布情况考虑多样本数据库的工程批复时间跨度为2003~2019年,在对经济类统计数据进行分析前,应结合我国经济发展的影响,将数据库中各样本与经济相关的数据修正到在库最新年份(2019年),使这些数据处于同一历史阶段、同一经济水平,数据分析更合理。按样本工程初步设计批复时间,将线路长度L、车站数量N、车站总建筑面积A等规模类统计数据展开对应时序散点分布图,总概算C、工程费E、单公里技术经济指标P等经济类统计数据展开对应时序散点分布图,如图1、图2所示。10.3969/j.issn.2096-1936.2021.17.057.F001图1样本工程规模类统计数据的时序散点分布10.3969/j.issn.2096-1936.2021.17.057.F002图2样本工程经济类统计数据(修正后)的时序散点分布由图1、图2可知,城市轨道交通工程各项统计数据的散点分布,未体现明显的规律性、趋势性、集中或分散性。4.2正态分布验证Q-Q图是验证数据是否符合正态分布的一种有效手段。对城市轨道交通工程规模类与经济类统计数据分别进行正态分布Q-Q图比对,结果如图3、图4所示。10.3969/j.issn.2096-1936.2021.17.057.F003图3样本工程规模类统计数据的正态分布Q-Q图10.3969/j.issn.2096-1936.2021.17.057.F004图4样本工程经济类统计数据(修正后)的正态分布Q-Q图可以初步判定,线路长度L、车站数量N、车站总建筑面积A、总概算C、工程费E、单公里技术经济指标P等统计数据,均符合正态分布特征。4.3正态分布统计分析经过正态分布Q-Q图初步验证后,将城市轨道交通工程规模类与经济类统计数据的正态分布频率柱状图与概率密度曲线图进行绘制。如图5、图6所示。10.3969/j.issn.2096-1936.2021.17.057.F005图5样本工程规模类统计数据的正态分布10.3969/j.issn.2096-1936.2021.17.057.F006图6样本工程经济类统计数据(修正后)的正态分布获得正态分布统计分析如表1、表2所示。10.3969/j.issn.2096-1936.2021.17.057.T001表1样本工程规模类统计数据的正态分布参数正态分布变量期望值标准差峰度偏度样本数线路长度/km25.83913.004-0.085 20.420 5121车站数量/座17.28.5-0.505 50.173 2121建筑面积/万m227.738 015.571 80.056 60.583 76510.3969/j.issn.2096-1936.2021.17.057.T002表2样本工程经济类统计数据(修正后)的正态分布参数变量期望值标准差峰度偏度样本数工程总概算/亿元191.685 2100.327 50.395 90.584 6121工程费/亿元108.550 456.255 70.018 10.417 4106技术经济指标/(亿元/km)7.618 81.999 30.282 0-0.072 9121由表1和图5可知,线路长度L符合[μ=25.839,σ=13.004]正态分布,呈低峰、右偏态;车站数量N符合[μ=17.2,σ=8.5]正态分布,呈低峰、右偏态;车站总建筑面积A符合[μ=27.738 0,σ=15.571 8]正态分布,呈低峰、右偏态。由表2和图6可知,总概算指标C符合[μ=191.685 2,σ=100.327 5]正态分布,呈尖峰、右偏态;工程费指标E符合[μ=108.550 4,σ=56.255 7]正态分布,呈低峰、右偏态;单公里技术经济指标P符合[μ=7.618 8,σ=1.999 3]正态分布,呈尖峰、左偏态。4.4由样本推断至总体根据正态分布特征,上述城市轨道交通工程规模类与经济类统计数据的正态分布验证与分析结果,在无其他制约或影响因素的前提下,可由样本推断至总体,作为描述我国城市轨道交通行业总体层面规模类与经济类对应数据的统计推断。总体期望值μ与样本期望值取值相同,总体标准差σ按样本数n-1计算获得,与样本标准差略有差异。城市轨道交通工程统计数据正态分布参数如表3所示。10.3969/j.issn.2096-1936.2021.17.057.T003表3城市轨道交通工程(总体)统计数据正态分布参数正态分布变量总体期望值总体标准差取值范围线路长度/km25.83912.95012.889~38.789车站数量/座17.28.58~26车站总建筑面积/万m227.738 015.451 612.286 4~43.189 6工程总概算/亿元191.685 299.912 191.773 1~291.597 3工程费/亿元108.550 455.989 752.560 7~164.540 1经济指标/(亿元/km)7.618 81.991 05.627 8~9.609 85结语本文以城市轨道交通工程多样本数据库中若干统计数据作为研究对象,对规模类与经济类数据分别进行统计学正态分布特征验证与应用分析,得到相关结论。(1)以线路长度L、车站数量N、车站总建筑面积A等为代表性的城市轨道交通工程规模类统计数据,以总概算C、工程费E、单公里技术经济指标P等为代表性的经济类统计数据,经验证均为正态分布,并具有显著特征。(2)基于上述统计数据的正态分布特征,可由样本工程推断至行业总体,揭示出我国城市轨道交通行业在总体层面上的统计数据正态分布情况与内在客观规律。综上所述,符合正态分布特征的样本统计数据,体现出我国城市轨道交通行业所符合的基本规律,展现出城市轨道交通工程多样本数据库建立与持续丰富的重要意义,为进一步深入进行其他统计分析工作提供了重要前提条件,也为我国城市轨道交通工程领域在总体层面上的行业分析与发展研究等相关工作提供了必要的借鉴与数据基础。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读