10.13557/j.cnki.issn1002-2813.2023.12.040.F001出版时间:2016年7月 ISBN:9787300230627 定价:38元统计学是收集、分析、展示和解释数据方法性质的科学。大数据拓展了统计学的研究对象,大数据技术成为统计分析的重要工具,从不同方向改变统计工作模式。许多统计指标获取需要依靠大型软件程序协助,数据采集方式不断更新和提高,通过数据挖掘找到数据之间的关联,统计结果从宏观向中观和微观转变,通过统计分析大数据了解各方面的信息。中国人民大学出版社出版的吴翌琳、房祥忠的著作《大数据探索性分析》,从多个角度探索大数时代统计分析的新技术和新方法。全书共分六章。第一章分析大数据现象产生的背景和大数据探索性分析的主要内容;第二章研究大数据背景下的抽样分析;第三章研究大数据的数据预处理;第四章研究探索性数据分析方法;第五章研究大数据展示,包括单变量数据展示、多变量数据展示、数据分布形态展示、高维数据展示、空间数据展示和统计图美化;第六章研究空间数据分析,包括空间自相关分析、时空扫描统计分析、空间回归分析、空间面板分析、贝叶斯空间模型和空间估算。书中提及的大数据抽样技术、数据缺失值处理技术、空间回归分析技术和多维数据可视化技术对饲料物流数据统计分析具有极高的应用价值。第一,大数据抽样技术。通常大数据抽样可以设计科学有效饲料物流多阶抽样调查方案,采取最优加权或杠杆子抽样方法提取代表性的饲料物流样本,运用轮换样本回避因人的心理而产生的误差。对于网络流量大数据的饲料物流统计分析,可以采用流抽样,先对分组进行流归并,再对流进行抽样。对饲料物流数据抽样可以显著降低饲料物流数据处理的复杂程度,有效验证饲料物流大数据推理结论的可靠性。第二,数据缺失值处理技术。饲料物流数据缺失不可避免。一般传统方法使用删除有缺失值的观测和找到合理数据插补缺失值。但采用大数据技术处理缺失值更倾向于使用能够处理缺失数据的模型。回归插补是对缺失变量和已观测变量建立Logistic线性回归模型,使用预测值插补缺失值;随机回归插补是对回归插补的改进,首先计算回归系数和误差项方差,然后生成回归插补值;多重插补是基于重复模拟处理缺失值的方法,采用蒙特卡罗模型生成完整数据集,再用标准统计方法生成插补值,通过缺失值处理,实现饲料物流数据的清理、集成、变换和归纳等数据处理工作,实现对饲料物流数据的高质量挖掘。第三,空间回归分析技术。空间回归分析技术主要采用空间自回归模型和地理加权回归模型。空间自回归模型使用地理区域观测数据集进行拟合,准备好饲料物流数据后,创建模型所需的空间权重矩阵,拟合模型并解释模型;地理加权回归模型将饲料物流数据的空间位置嵌入到回归参数,统计饲料物流数据之间是否存在空间非稳定性,空间权函数可以使用距离阈值法、距离反比法或Gauss函数法。空间回归分析可以对饲料物流需求进行预测,辅助饲料物流基础设施规划。第四,多维数据可视化技术。大数据探索性分析主要包括三个方面。基于二变量的数据可视化技术,目前广泛使用散点图法,通过散点图矩阵画出多个变量两两间的散点图来考察物流数据多变量关系;基于多变量的数据可视化技术,目前广泛使用脸谱图法,在大量相似物流数据中发现奇异点,或根据表情对物流数据进行聚类;基于动画的数据可视化技术,目前广泛使用漫游法,将高维物流数据投影到二维子空间,通过较小的计算量得一系列散点图,形成均匀、可恢复的投影。多维可视化技术可以共享饲料货物的各种特征信息,实现饲料品质信息的区域分析和共享。将大数据时代的统计分析方法应用于饲料物流,在实时采集饲料运输数据后,运用大数据等技术,自动生成承运方提货准时率、时效监控、异常分析、货损率和签收满意度等数据报表,助力饲料企业考察承运方的运输行为,规范运输标准,提高饲料物流服务的水平和运输效率。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读