近年来,随着我国新型城镇化工程建设的快速推进和发展,城市主干道上的私家车辆数量急剧攀升,逐步超过了现有公共道路的总体承载能力,出现了交通拥堵这一重要的难题,给人们的生活和出行工作造成了诸多困扰.目前缓解交通拥堵主要采取两种途径:一种是对城市道路系统进行改建,将现有道路拓宽,但是此方法会耗费大量的财力,在城市的可行性不高;另一种是在现有道路结构不变的基础上,利用交通管制策略来优化路网结构,提高道路的出行效率.因此,短时交通流预测成为热门的研究领域之一,利用预测结果可以诱导人们的出行线路,在很大程度上缓解交通拥堵现象.目前短时交通流预测方法有ARIMA(差分整合移动平均自回归模型)、ANN(人工神经网络)、SVM(支持向量机)和组合算法[1]等,以上方法在交通流预测领域有着广泛的应用,但因为交通流量有着非线性和不稳定性的特点,过去的预测方法无法提高预测准确性.近年来,深度学习广泛应用于智能交通领域.文献[2]利用卷积神经网络和长短时记忆网络进行预测,但RNN(循环神经网络)在训练过程中易出现梯度爆炸的缺陷.文献[3]提出卷积神经网络和双向长短时记忆网络的组合结构模型,虽然该模型在数据集上具有一定的优越性,但是单纯的CNN(卷积神经网络)并不能充分挖掘交通流的空间特征.文献[4]提出一种DFCNN(扩张-因果卷积神经网络)模型,该模型通过引入扩张卷积来增加感受视野,获取序列的长时记忆.文献[5]提出一种ConvLSTM(卷积长短时记忆网络)混合模型,该模型充分考虑了短时客流的时空特征,结合自适应K-means(K均值聚类算法)有效提高了预测的准确性,但是将卷积层嵌入到LSTM(长短时记忆网络)网络中具有一定的复杂性.文献[6]使用卷积神经网络和参数经果蝇算法优化的XGBoost(极度梯度提升)模型进行预测,但在提取时间序列特征方面有一定的局限性.文献[7]利用结合注意力机制的卷积门控循环单元预测短时交通流,在真实数据集上显示出一定的优越性,但该模型注重在时间序列特征的提取,而忽略了交通流的空间特征同样重要,单一卷积神经网络很难有效挖掘交通流的空间特征.文献[8]提出CLM(卷积神经网络与长短时记忆网络)模型,CNN被首次用来提取工作日的速度周期性,LSTM用来处理卷积神经网络输出矩阵的时间序列的特性,对比其他模型,该模型能够较好预测时间段的交通速度,但该组合模型的时间特征部分同样存在梯度爆炸的问题.文献[9]提出结合时空分析和GRU(门控循环单元)的短时交通流预测模型,对交通流数据进行时间和空间相关性分析,利用时空特征算法定义最优的输入矩阵,使用GRU网络对时空特征进行处理,结果表明该方法比CNN和GRU模型在精度和稳定性方面有着更好的性能.文献[10]提出一种基于卷积神经网络的并行CNN,利用时空属性预测未来5 h以上的韩国公路路段,实验表明所提出的方法比传统方法各项指标均有不同程度降低,但该模型并未考虑时间特征对预测带来的影响.文献[11]结合对抗训练和图CNN提出一种GCGAN(网络规模的深度流量)预测模型,通过引入对抗训练损失解决模糊预测问题,从整体上充分获取各个路段的空间相关性,结果表明GCGAN算法相比传统深度学习算法具有优异的性能,但却没有有效捕捉时间序列的特点.文献[12]提出一种ConvLSTM模型用来估计短时交通流,该模型既描述了局部空间特征又像传统的LSTM模型一样建立了时序特征,试验结果表明ConvLSTM模型的预测精度高于传统的LSTM预测模型.文献[13]利用改进胶囊网络和注意力机制结合对城市交通路网进行短时交通流预测,具有较好的精度和性能.针对上述预测模型未能有效整合交通流量的空间特性及传统时间序列模型易出现梯度爆炸的问题,本研究提出一种引入注意力机制的卷积神经网络,将注意力机制作为单独的一层嵌入到CNN网络中,对两次卷积层的结果进行不同权值的关注,有效挖掘交通流的空间特征;将交通流以二维矩阵形式输入,并结合引入注意力机制的卷积神经网络和双向门控循环单元构建组合模型,融合交通流量的时间和空间特征进行短时交通流预测.1 组合预测模型1.1 模型设计针对交通流的特点,本研究提出ACBiGRU组合模型,结合了注意力机制的卷积神经网络和双向门控循环单元.ACBiGRU组合预测模型主要由三部分组成:第一部分是空间特征提取,在卷积神经网络中引入注意力机制,计算各个节点之间的空间相关特性,进一步挖掘空间特征;第二部分是时间特征提取,使用BiGRU网络充分提取交通流时间序列的特性;第三部分是一个全连接层,结合交通流的时间特性和空间特性进行最终预测.ACBiGRU模型结构如图1所示,图中:C为卷积层;A为注意力机制层.10.13245/j.hust.228120.F001图1ACBiGRU模型结构图1.2 引入注意力机制的CNN网络(ACNN)本研究使用ACNN(引入注意力机制的卷积神经网络)提取各条道路交通流的空间特征,整体结构如图2所示.10.13245/j.hust.228120.F002图2ACNN结构图在此网络结构中,包含以下网络层.a.Input(输入层).将交通流以二维矩阵Xij(交通流数据)形式输入.b.Conv1(卷积层1).将输入的矩阵用64个3×3的卷积核进行第一次卷积,stride(步长)为1,激活函数为RELU(线性整流函数),第一次卷积公式和RELU公式分别为yconv1=W1*Xij+b1;y1=yconv1    (yconv10),0    (yconv1≤0),式中:*为卷积运算;W1和b1分别为Conv1的权值和偏差;yconv1为第一次卷积运算输出的结果;y1为经过非线性映射之后的结果.c.Pool1(池化层1).对Conv1的结果进行最大池化操作,池化卷积核为2×2,stride为2,第一次最大池化计算式为ypool1=max((y1)2,2),式中ypool1为第一次最大池化后的结果.d.Conv2(卷积层2).对池化结果进行第二次卷积,使用64个3×3的卷积核,stride为1,激活函数为RELU,第二次卷积公式和RELU公式分别为yconv2=W2*ypool1+b2;y2=yconv2    (yconv20),0    (yconv2≤0),式中:W2和b2分别为Conv2的权值和偏差;yconv2为第二次卷积运算输出的结果;y2为经过第二次非线性映射之后的结果.e.Pool2(池化层2).对Conv2的结果进行第二次最大池化操作,池化卷积核为2×2,stride为2,第二次最大池化计算式为ypool2=max((y2)2,2),式中ypool2为第二次最大池化后的结果.f.A1(Attention层1).对Pool2的结果进行不同权重的关注.由于路网是复杂、动态且非线性的,因此不同时刻对于路网中的道路关注权重是不同的.当CNN在提取交通流空间特征时不能全局地关注各条道路交通流的变化,单纯的CNN模型并不能很好提取交通流中的空间相关性,因此本研究提出使用注意力机制[14]关注交通流各条道路之间的空间联系,重点分析隐藏的空间相关特性,从不同时间点的路网信息中自适应衡量各条道路的重要程度.由于各个时刻的交通流特征对预测时刻流量的影响程度不同,将某一时刻t所有道路的信息聚合为一个向量,这里的信息包含t时刻路网的空间特征和道路信息,计算公式为qt=RELU∑i=1NW*ypool2,式中:qt为t时刻所有道路信息的聚合;RELU(∙)为线性整流函数;W为可训练参数.那么所有道路注意力分数的计算方法为αt=Softmax(Ustanh(Whypool2+Wqqt+bs)+bu),式中:αt=(αt1,αt2,...,αtN),其中αti为t时刻第i条道路相对的注意力分数;Us,Wq和Wh为可训练参数;bs和bu为偏置项.注意力机制的输出ht由αt与引入注意力机制的卷积神经网络在t时刻的输出ypool2做点积加权得到,计算公式为ht=αt∙ypool2.1.3 基于双向门控循环单元的时间特征提取双向门控循环单元BiGRU结合了双向RNN和GRU的优点,其由一个前向GRU隐藏层和一个后向GRU隐藏层组成,并且隐藏层与输出层连接,将前向和后向的信息同时传递给输出层.BiGRU的输出为Y(t)=WY∙[ht(F),ht(B)]+bY,式中:ht(F)和ht(B)分别为前向和后向隐藏层的输出;WY为权值矩阵;bY为偏置项.本研究将ACNN网络层提取的流量模式作为BiGRU层的输入,使交通流量保持时间上的连续性.2 实验研究及分析2.1 实验数据本实验主要研究结合时空特性的短时交通流,在提取空间特性方面使用的数据较为直观.实验数据选用杭州市某高架道路的交通流数据,包括三个月的数据,采集间隔为5 min,共计1.774 1×104组数据.数据集有着小概率缺失的问题,利用平均值进行填充.取数据的前60 min数据输入,用于预测下一个5 min的交通流数据,如图3所示,图中10.13245/j.hust.228120.F003图3ACBiGRU预测结构图H(∙)为模型预测中的滑动窗口.首先将前12个时刻的交通流数据输入到ACNN网络中提取空间特征,然后网络的输出作为BiGRU网络的输入用来提取交通流的时间序列特征,最后利用全连接层得到最终的预测结果.训练集样本共计1.241 8×104组,测试集样本共计5 312组.数据集的一些关键信息如下:数据集为HZDATA,节点数为35,长度为三个月,单元为5 min,数据集大小为1.774 1×104.本研究采用的交通流数据是采集于杭州高架道路的交通流数据,数据内容包含时间和车流量两部分,其中:时间部分间隔为5 min,即每5 min对应一个车流量数值;车流量为具体某个数值,代表通过的车辆数,范围从0开始,无上限.由于在采样过程中节点的分布位置具有一定空间结构,因此所采集的车流量大小具有空间相关性,本研究中输入特征包含时间特征和空间特征两部分.2.2 评价指标为了有效评价交通流预测模型,引入评价指标.短时交通流预测模型用于预测下一个时间步长的交通流,为了判断预测的准确性,需要客观的评价指标来表达预测的准确性.三种常用的评价指标为RMSE(均方根误差)、MAE(平均绝对误差)和MAPE(平均绝对百分比误差),RMSE(RMSE),MAE(MAE)和MAPE(MAPE)的计算公式分别为RMSE=1n∑i=1nyi-y^i21/2;MAE=1n∑i=1ny^i-yi;MAPE=1n∑1nyi-y^iyi,式中:y^i为实际值;yi为预测值;n为训练数据的个数.2.3 ACBiGRU组合模型参数设置ACBiGRU短时交通流预测模型结构包含CNN卷积层、CNN池化层、Attention注意力机制层、全连接层和BiGRU模型网络层数的设置及模型参数的修改.组合模型中的CNN层数为2,卷积核个数为64,卷积核的大小为3×3,使用非线性映射函数RELU;最大池化Maxpooling层数为2;注意力机制层数设为1;使用优化算法Adam(自适应性矩估计)反向传播,训练参数batch_size设置为1.2.4 实验结果与分析由于交通流数据具有一定的周期性和规律性,因此使用前60 min的历史数据来预测后5 min的交通流数据.将ACBiGRU组合模型与三种传统模型对比,组合预测模型与传统模型的性能指标对比、空间特征提取能力对比及与文献[6]各项指标对比如表1所示.为验证组合模型所具有的优越性,与传统LSTM,GRU和BiLSTM(双向长短期记忆网络)模型预测对比,如图4所示.为验证注意力机制在空间特征提取方面的效果,分别将CNN与ACNN,CNNBiGRU(去除注意力机制后的组合模型)与ACBiGRU模型进行对比,分别如图5和图6所示.10.13245/j.hust.228120.T001表1不同预测模型的性能指标对比模型RMSEMAEMAPE/%LSTM17.3112.4313.29GRU18.0612.5213.31BiLSTM17.1712.3813.61CNN30.0521.2020.61ACNN25.0417.5712.98CNNBiGRU9.986.9111.44文献[6]9.308.0413.80ACBiGRU8.645.995.7310.13245/j.hust.228120.F004图4传统模型预测效果对比10.13245/j.hust.228120.F005图5空间特征提取能力对比图10.13245/j.hust.228120.F006图6CNNBiGRU与ACBiGRU对比图从表1中可以定量看出:ACBiGRU组合预测模型具有最好的预测性能,与传统模型LSTM相比,RMSE降低了8.67%,MAE降低了6.44%,MAPE降低了7.56%.由此看出:本研究提出的交通流组合预测模型在充分提取交通流数据的时间和空间特征后,在真实的数据集上具有一定优越性.表中其他模型均仅考虑了时间或空间单一维度的特征,未能时空结合进行预测交通流,且模型结构单一,网络层次较浅,拟合能力较差,不能充分提取交通流数据的特征.为了较好说明所提出的组合模型在短时交通流预测方面的优越性能,对比文献[6],在采用相同数据集的情况下,组合模型在空间特征提取和最终预测结果方面都有更优越的性能.从表1中可知:组合模型在空间特征提取MAPE评价指标相比文献[6]降低了0.82%,相比文献[6]提出的模型,组合模型的评价指标值更小,充分说明在选取相同数据集的条件下所提出的短时交通流组合预测模型预测值更加精确,与其他模型相比有更好的性能.这是由于在空间层面,组合模型采用引入注意力机制的卷积神经网络提取空间特征,利用不同权重大小关注交通流数据,保留更为有效的信息,增强了特征提取能力;在时间层面,采用双向机制提取时间特征,加强了对交通流时间序列的提取能力.为了凸显注意力机制的优势,在实验中设置了CNN与ACNN,CNNBiGRU与组合模型ACBiGRU的对比试验.从表1中可以看出:结合注意力机制的卷积神经网络在提取空间特征方面比单纯的卷积神经网络有着更好的效果,能够充分捕捉隐藏节点之间的空间特性,评价指标RMSE,MAE和MAPE分别降低了5.01%,3.63%和7.63%,本研究提出的模型ACBiGRU对比CNNBiGRU在三个评价指标上均有着不同程度的提升,两个模型的区别主要在空间提取阶段,CNNBiGRU模型使用传统CNN模型提取空间特征,而ACBiGRU模型则使用引入注意力机制的CNN,在提取能力上更强,使得最终指标更好,模型性能更好,体现出注意力机制在空间特征挖掘方面的较好性能.由表1还可以看出:组合预测模型对比文献[6],三项指标均有不同程度降低,其中MAPE降低了8.73%,效果最为明显.为了说明组合模型的预测效果,选取LSTM,GRU和双向LSTM三种传统模型进行对比.在实验中,三种网络的参数设置均与本研究提出的模型一致.由图4可以看出:组合预测模型的预测效果较好,最贴近真实数据,能较好拟合出交通流量地变化趋势;传统LSTM模型预测效果则有着明显的滞后性,与真实值差异性较大,不能准确预测交通流;GRU与BiLSTM模型虽然在整体上预测效果不错,但是在最后阶段有较大的误差,所预测的交通流趋势与真实值相反,不能准确预测交通流量.由图5和图6可以看出:引入注意力机制的卷积神经网络相比于普通的卷积神经网络能更有效地挖掘节点之间的空间特征,在整体模型预测中,组合模型ACBiGRU的预测曲线可以较好贴合真实值,波动较小.3 结语本研究提出一种ACBiGRU的深度神经网络模型.该模型首先利用引入注意力机制的CNN挖掘交通流的空间特征,通过注意力机制进一步增强空间特性的提取,然后使用双向门控循环单元提取交通流量的时间特性.实验结果表明:ACBiGRU组合模型可以有效提取交通流量的时空特性,提升短时交通流预测精度.然而,本研究仅考虑了短时交通流量预测,未考虑中长时预测问题,且忽略了天气、节假日等多方面因素的影响,后续研究将重点关注交通流中长时和天气等因素影响下的预测问题.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读