引言杭州市萧山区作为全国率先推动“双碳大脑”建设、以数字化管控碳排放的地区之一,碳排放量预测对萧山未来碳政策制定有着十分重要的意义。目前碳排放的预测方法主要分为两种:(1)通过历史碳排放数据对未来碳排放进行趋势分析,主要是以历史排放量为自回归数据进行线性或非线性拟合;(2)建立碳排放的驱动因素模型。第一种方法的优点是对数据的需求量较小,只需要历史数据,但同时也存在“惯性”问题,即对数据波动的反应存在滞后现象,并且预测时无法反应未来已制定政策对数据的影响。常用的方法包括ARIMA模型、灰色预测模型、指数平滑法、神经网络模型等。第二种方法通过建立因果关系预测碳排放趋势,能根据未来政策规划预测碳排放,但是局限在需要对多个数据进行预测,存在一定主观性。为了综合利用不同方法的特点,克服单一模型的局限性,目前常采用组合模型。理论表明,将各种模型通过不同权重进行组合,能明显提高预测精度[1]。姜洪殿[2]等通过变权重组合模型结合BP神经网络和灰色模型预测我国新能源消费量。李宇卿[3]组合BP神经网络与VAR模型预测我国的能源消费量,结果显示组合后的模型相对误差和均方根误差更小,改进后模型的精度更高。高迪[4]等以上海市为例建立ARIMIA-BP神经网络模型能源消费模型,研究表明线性和非线性的组合模型拥有更高的精度。张全斌[5]等发现组合模型能显著提高预测精度。通过以上研究发现,组合模型可以有效提高预测精度。由于我国碳核算数据库中县级清单数据相对来说还不够完善,本研究以县级清单中杭州市萧山区1997—2017年碳排放为对象,建立ARIMA、NAR神经网络和STIRPAT模型的组合模型。ARIMA和NAR神经网络可以有效组合模型中时间序列的线性和非线性关系,同时引入STIRPAT模型,将“十四五”政策规划对碳排放的影响加进模型中,构造萧山区2025年碳排放预测模型。1研究方法与数据来源1.1模型介绍1.1.1ARIMA模型ARIMA是建立在美国统计学家Jen Kins和Box提出的ARMA模型上研究非平稳离散数列的方法[6]。ARMA模型是AR模型和MA模型的组合形式,回归方程的形式为:Yi=τ+δ1yi-1+δ2yi-2+…+δpyi-p+σi- φ1gi-1+φ2gi-2+…+φqgi-q (1)式中:τ——常数;δi——回归模型中的白噪声序列;gi-1,gi-2,…,gi-q——残差序列;p——AR模型的阶数;q——AM模型的阶数。ARMA模型只能处理平稳数列,通常需要采取差分的方式使非平稳数列变得平稳,根据差分的次数d可以建立相应的ARIMA(p,d,q)模型。1.1.2NAR神经网络模型NAR神经网络是一种非线性自回归动态神经网络,NAR动态神经网络结构如图1所示。10.3969/j.issn.1004-7948.2022.04.019.F001图1NAR动态神经网络结构相较于静态神经网络,动态神经网络能在计算阶段能根据系统之前的计算结果,自动调节自身的结构和参数,因此动态神经网络可以拥有更强的推理表达能力[7]。NAR神经网络采用静态神经元和各网层的反馈形成动态神经网络[8],其回归方程表达式为:Yi=μ1Yi- 1+μ2Yi- 2+μ3Yi- 3+⋯+μnYi- n+εi (2)式中:ε(i)——残差项;n——神经网络延迟数。NAR神经网络的隐藏层由神经元构成,神经元是神经网络的基本单元,基本结构如图2所示。神经元首先接收到输入信号,再根据自身的阈值θ和激活函数f输出信号。其中wi为输入信号的权重,θ为神经元阈值,f为神经元激活函数。神经元首先接收输入信号,通过权重决定输入信号的数值大小,比较输入信号与自身阈值大小,决定激活还是抑制神经元,最后通过激活函数f将该神经元的信号传递给下一个神经元。10.3969/j.issn.1004-7948.2022.04.019.F002图2人工神经元结构1.1.3STIRPAT模型STIRPAT模型是York[9]等在IPAT模型的基础上提出的随机特殊形式,通过引入弹性系数消除IPAT模型同比例变动的问题,具有十分良好的拓展性。该模型综合考虑了人口、技术和财富等3个方面因素对碳排放的驱动效果,是目前研究分析碳排放最常用的模型之一。STIRPAT模型的基本形式为:I=αPbAcTde (3)式中:I——环境压力;P——人口因素;A——财富因素;T——技术因素;e——未被考虑的因素;α——模型系数;b——人口弹性系数;c——财富弹性系数;d——技术弹性系数。综合考虑可获取数据情况,选取常住人口数为人口因素、人均GDP为财富因素、单位GDP能耗为技术因素,通过对STIRPAT模型的基本形式进行对数处理,将方程变化为线性形式,变换后的形式为:lnI=lnα+blnP+clnA+dlnT+lne (4)1.1.4组合模型不同的预测方法各有优缺点,对信息提取的角度也不同,综合考虑不同的预测方法进行组合,多种预测方法相结合能够有效增强预测模型对信息的提取。组合预测的方法总体上可以分为线性和非线性两种类型。本研究采用最优加权组合预测模型,通过构造误差矩阵,在约束条件下,根据拉格朗日乘子法求出最优权重系数[10]。P=E-1RRTE-1R (5)式中:P——组合系数向量,P=[P1,P2,…,Pn]为;R=[1,1,…,1];T、E——误差矩阵。E=∑i=1ne1i2⋯∑i=1ne1ieji⋮⋱⋮∑i=1nejie1i⋯∑i=1neji2 (6)式中:j——第j个模型;i——时间序列数。目标函数的约束条件为:Q=min∑i=1nei2 (7)s.t∑i=1npi=1 (8)即误差平方和最小,并且保证组合系数之和为1。1.2模型评价指标预测精度是预测模型评价的主要指标,模型的预测误差决定预测的精确度。本研究主要选取平均相对误差百分数(MAPE)和均方根误差(RMSE)为模型的误差评价指标。MAPE=1n∑inYi- Y̌iYi (9)RMSE=1n∑inYi- Y̌i2 (10)式中:n——观测样本数据量;Yi——样本实际值;Y̌i——拟合数据值。评价预测模型的另一项指标是模型的拟合优度,即评价预测模型对被解释变量的解释能力,拟合优度R2越大,模型对被预测数据的解释能力越强,拟合效果越好。R2=1- ΣYi- Y̌i2ΣYi- Y¯2 (11)式中:Y¯——样本均值。拟合优度R2取值范围在0~1之间,R2越接近1,说明拟合效果越好。除上述指标外,根据每个模型各自的特点再选取部分评价指标。1.3数据来源本研究中萧山区1997—2017年的碳排放数据来自我国碳核算数据库,结果如图3所示。10.3969/j.issn.1004-7948.2022.04.019.F003图31997—2017年萧山碳排放单位GDP能耗来自历年《杭州市统计年鉴》推算;2007—2019年常住人口、GDP等数据来源《萧山统计年鉴》;2025年常住人口根据《杭州市国土空间总体规划(2021—2035年)》和萧山占杭州人口比例推算;萧山GDP、单位能耗根据《关于印发杭州市萧山区国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要的通知》和《浙江省节能降耗和能源要素优化配置“十四五”规划》推算。2025年萧山(包含大江东)相关指标如表1所示。10.3969/j.issn.1004-7948.2022.04.019.T001表12025年萧山(包含大江东)相关指标指标数值GDP/亿元3 005人口/万人239.63“十四五”单位能耗下降率/%14.62单项预测模型2.1ARIMA模型2.1.1数据平稳性检验如果直接对非平稳序列使用ARMA模型,可能产生“伪回归”现象,使用EViews软件对萧山1997—2016年碳排放原始序列进行ADF单位根检验,检验结果P值为0.8。碳排放是一个非平稳的时间序列,通过一阶差分消除非平稳性,差分之后检验P值为0.045 8,可以认为差分之后数列已经平稳,差分之后的结果如图4所示,单位根检验结果如表2所示。10.3969/j.issn.1004-7948.2022.04.019.F004图4碳排放一阶差分10.3969/j.issn.1004-7948.2022.04.019.T002表2单位根检验结果结果检验临界值ADF单位根检验统计量1%5%10%t统计量-3.857 386-3.040 391-2.660 551-3.086 885P———0.045 82.1.2模型选择通过单位根检验可以确定模型差分次数为1,还要确定模型p和q的阶数。通过自相关系数ACF和偏自相关系数PACF大致确定p和q的阶数。ACF和PACF系数图如图5所示。图5ACF和PACF系数图10.3969/j.issn.1004-7948.2022.04.019.F5a110.3969/j.issn.1004-7948.2022.04.019.F5a2从图5可以看出,偏自相关系数均在置信区间内,但综合考虑拟合优度和正态BIC,考虑采用ARIMA(4,1,0)模型。2.1.3模型评价根据生成的ARIMA(4,1,0)模型,通过SPSS软件可以获取评价模型对指标。ARIMA(4,1,0)模型结果如表3所示。通过SPSS生成的模型评价指标可以发现,ARIMA模型的拟合优度接近1,对被解释变量的解释效果越好,RMSE、MAPE、MAE均在合理范围,正态化BIC较小,说明模型没有过拟合情况,以上指标说明模型能很好地进行预测。10.3969/j.issn.1004-7948.2022.04.019.T003表3ARIMA(4,1,0)模型结果评价指标数值平稳R20.980 4RMSE0.803 4MAPE/%5.165 5MAE0.532 8正态化BIC0.492 2检验年份误差/%1.712.2NAR神经网络模型2.2.1神经网络结构设计使用神经网络进行训练预测之前,首先需要考虑神经网络的结构,主要考虑如何选取隐藏层的神经元个数、延迟数、训练算法、训练集比例、激活函数。选取的神经元个数、延迟数较大时虽然能增强学习效果,但通常会增加训练时长,同时可能产生过拟合的问题。如果选取神经元个数较少、延迟数较少则导致学习效果不佳,出现欠拟合的情况。根据经验公式可以确定神经元个数的选择范围:n=m+1+a (12)式中:n——隐藏层神经元个数;m——输入量个数;a——不大于10的整数。通过公式(12)估算神经元个数的选取范围为[3,13],神经元最终的个数和延迟数还是依靠拟合的效果而选定,最终选取神经元个数为7个,延迟阶数为4时。为避免过拟合,划分训练、测试数据的比例为3∶1。训练算法主要影响学习的时长和学习效果。本研究中拟合数据量较少,考虑使用训练效果更好、训练时间较长的训练算法。BFGS-拟牛顿算法需要的存储空间大、迭代次数较多,但收敛效果较好,比较适合小型网络使用。对于处理非线性拟合,一般采用Sigmoid函数作为隐藏层激活函数,网络传输层选择线性激活函数有利于放大结果。所以本研究中的隐藏层选用Sigmoid函数中的双极性S函数tansig,输出层采用Purelin线性激活函数。NAR神经网络结构如图6所示。10.3969/j.issn.1004-7948.2022.04.019.F006图6NAR神经网络结构2.2.2模型评价本研究主要通过Matlab R2020b软件实现NAR神经网络对1997—2017年萧山碳排放进行非线性回归拟合,以2017年作为测试年,拟合的数据如图7所示。因为选择延迟数m=4,所以从2000年开始计算拟合值。通过NAR神经网络训练第44次后,模型的MSE已经到达最小并且稳定,R值接近1,检验年份误差百分比为5.75%,说明训练好的模型能够对被解释变量进行很好地解释,所以模型可以作为预测使用。图7神经网络训练效果及萧山碳排放非线性回归拟合曲线10.3969/j.issn.1004-7948.2022.04.019.F7a110.3969/j.issn.1004-7948.2022.04.019.F7a22.3STIRPAT模型2.3.1普通最小二乘法估计对于线性回归方程,首先考虑使用普通最小二乘法对回归方程进行处理。运用SPSS软件对数据进行处理,结果如表4所示。财富因素和技术因素的VIF值均超过10,表明最小二乘法拟合之后的回归方程存在多重共线性问题,最小二乘法无法很好地拟合回归方程,因此考虑使用岭回归拟合回归方程。10.3969/j.issn.1004-7948.2022.04.019.T004表4最小二乘法结果分析变量标准化系数标准化系数t显著性共线性统计B标准错误Beta容差VIF常系数项-5.3624.461—-1.2020.268——lnP1.5240.9250.7071.6470.1440.1377.275lnA0.2670.2390.7951.1180.3000.05019.957lnT0.2920.3320.6010.8790.4080.05418.4692.3.2岭回归岭回归是一种专门适用于处理共线性数据分析的方法,本质上是对最小二乘法的改良,适用于处理本研究中出现的多重共线性问题。在SPSS软件中可以使用Ridge Regression代码调出软件中内置的岭回归功能,以2007—2016年碳排放量对数为因变量,常住人口数、人均GDP、单位GDP能耗对数为因变量,得到岭回归拟合优度R2与惩罚系数K值之间的关系如图8所示。图8岭回归系数运算结果10.3969/j.issn.1004-7948.2022.04.019.F8a110.3969/j.issn.1004-7948.2022.04.019.F8a2由图8(a)可知,随着惩罚系数K值的增加,拟合优度R2不断减小,因此K值不能选取过大,同时K值还应当根据图8(b)选取,只有确保图8(b)中岭回归系数趋近于平稳,才具有最佳的拟合效果。综合考虑,选取K=0.7进行岭回归,通过SPSS软件进行岭回归后,得到STIRPAT模型的形式为:lnI=-1.587+0.836 8lnP+0.073 54lnA- 0.079 46lnT (13)2.3.3模型评价根据拟合的回归方程,可以得到2007年~2016年萧山碳排放的拟合值,通过SPSS软件可以获得模型评价指标,同时本研究以2017年为测试年份,测试拟合曲线的预测效果。STIRPAT模型拟合结果如表5所示。由SPSS软件生产的评价指标可以看出,拟合优度0.6,标准误差SE较小,显著性系数0.05,说明模型合格,可以作为预测模型。10.3969/j.issn.1004-7948.2022.04.019.T005表5STIRPAT模型拟合结果评价指标数值R0.856 8R20.734 1修正R20.601 2标准误差SE0.056 3F统计检验值5.522显著性系数0.036 7检验年份误差/%0.353组合模型截取3个模型2007—2016年的拟合数据为自变量,计算各个模型2007—2016年的模型指标,设H1为ARIMA模型预测值,H2为NAR神经网络预测值,H3为STIRPAT模型预测值,计算误差后构造误差矩阵:E=5.008 13.914 31.348 63.914 36.021 81.881 11.348 61.881 15.160 5根据误差矩阵可以计算3个模型的权重系数分别为0.428 5、0.104 4、0.467 0,构造组合模型为:y=0.428 5H1+0.104 4H2+0.467 0H3 (14)截取4个模型2007—2016年的拟合数据,计算各个模型的评价指标,结果如表6所示。通过最优权重系数组合各个模型之后,2007—2016年组合模型的拟合优度明显提高。同时均方误差和误差的方差均减小,说明误差总体变小,误差的离散程度变小,组合模型对被解释变量的解释效果更好,所以采用组合模型对萧山碳排放进行预测。10.3969/j.issn.1004-7948.2022.04.019.T006表62007—2016年各模型评价指标评价指标模型ARIMANAR神经网络STIRPAT组合模型拟合优度R20.770.810.730.83MAPE/%3.172.303.763.14RMSE0.707 60.776 00.718 30.564 3检验年误差/%1.715.750.351.504萧山碳排放量预测结果通过3种预测模型建立萧山碳排放组合预测模型,所得的预测结果如图9所示。从图9可以看出,萧山碳排放将继续增长。ARIMA(4,1,0)模型预测2025年萧山碳排放为2 379.93万t,NAR神经网络预测2025年萧山碳排放为2 245.64万t,STRIPAT模型预测2025年萧山碳排放为2 570.62万t,组合预测模型预测2025年萧山碳排放将达到2 454.98万t。根据碳排放结果和GDP指标可以推算2025年萧山碳排放强度将从2017年0.894 9 t/万元下降到0.817 0 t/万元。10.3969/j.issn.1004-7948.2022.04.019.F009图9萧山碳排放组合预测模型预测结果5结语(1)最优加权组合模型充分利用单个模型所提取的信息,结合线性和非线性,客观和主观的信息,使得拟合优度、相对平均绝对误差、均方根误差、检验误差等指标明显优于单个模型,可以使用组合模型对萧山碳排放进行预测。(2)根据1997—2017年萧山碳排放数据和“十四五”规划中推算的经济、人口、能耗等指标,建立组合模型后预测2025年萧山的碳排放将达到2 454.98万t,碳排放强度为0.817 0 t/万元。(3)预测结果表明,在延续过去减排政策,保持经济增长的情况下,虽然萧山碳排放强度有所下降,但是碳排放依然持续增长。制定合理减碳措施进一步降低碳排放强度将成为萧山能否实现碳达峰和经济增长“双平衡”的关键,萧山应该继续提高新能源占比,积极建设新型电力系统,减少外来电依赖,推动传统制造业高质量发展,实现产业结构转型,建设数字化平台,严格管控高耗能、高排放行业。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读