交通流预测作为交通诱导的重要参照已成为了当今智能交通的研究热点.早期的交通流预测研究主要针对单一监测器使用统计学模型进行预测.文献[1]首次将历史均值模型应用于交通流预测中.文献[2]设计了一种基于最小二乘的支持向量机模型,用于交通流数据预测.上述模型由于数据体量小,且并未考虑多监测器和模型表达力不足等因素,造成预测结果不够精确.文献[3]针对韩国某公路上4个观测点进行交通流分析预测,但因为卷积神经网络(CNN)[4]的池化层会删除部分数据,导致训练数据的位置信息丢失[5],所以使得卷积神经网络在训练数据集小的情况下预测效果较差.文献[6]提出胶囊网络(CapsNet),并将其用于Mnist数据集,准确率达到97.5%.文献[7]针对CapsNet的核心路由算法进行改进,提出了用于替代CNN池化层的EM(期望最大化)路由算法.在目前交通流预测领域中,主要将复杂的城市路网作为研究对象,在空间上相近路段的交通流呈现出较高的相关性.CapsNet由于采用了矢量胶囊和动态路由算法,使其有优于CNN的效果,能够更加有效地提取路网空间特征.另一方面,交通流具有很强的时间相关性,而循环神经网络(RNN)具有循环单元结构,使其能够记录交通流的历史信息,在交通流预测等时间序列问题的预测中有不错的效果.文献[8]提出递归长短期记忆网络(NLSTM).注意力机制主要通过其核心的打分函数来对数据进行自适应关注,可以有效捕获交通流的时空特性,生成含有注意力分布的交通流特征表示,从而提升模型的预测效果[9].文献[10]将注意力机制(attention mechanism,Attention)与LSTM结合,并将出发时间整合到模型中,与LSTM等基线模型相比有更高的预测精度.文献[11]提出了ACGRU模型,与其他基线模型相比有更高的精度.本研究提出ACapsGRU组合模型,将胶囊网络、门控循环单元和注意力机制相结合并应用到交通流预测领域进行短时交通流预测,为人们的出行提供更有效的诱导信息.1 模型构建针对交通流数据时空相关性、周期性、非线性等特点,本研究提出了ACapsGRU短时交通流组合预测模型.该模型主要由四部分组成:第一部分使用胶囊网络捕捉交通流数据空间特征并进行初步提取;第二部分引入注意力机制进行城市交通道路的空间相关性学习,并根据近期交通流数据生成注意力权重矩阵;第三部分使用GRU神经网络进行交通流数据周期性特征的学习;第四部分使用全连接层输出52条道路的预测值.1.1 交通流参数若一个有向路段有n个连续时间片,分别为t1,t2,…,tn,路段长度为S,那么t1到tn这段时间内,该有向路段的平均速度v=nS/∑i=1nti.若一条道路有N个有向路段, v为路段平均速度,则该道路的平均速度V为V=∑i=1NSi/∑i=1N(Si/vi).根据城市交通路网建立速度矩阵,将实际道路的经纬度映射到矩阵上,其中矩阵横纵坐标分别代表经纬度.以0.000 1°×0.000 1°(经纬度)为矩阵中每个元素的大小,以便于准确地表示出实际道路信息.在矩阵中,若有道路通过的位置,则记为该道路的平均速度,否则记为0.在道路交叉处的速度记为相交道路的平均值,计算公式为V¯= ∑k=1NVk/N,基于该式构建的速度矩阵如图1所示.10.13245/j.hust.220409.F001图1路网速度输入矩阵图速度输入矩阵每个位置的表示为X=V11V12⋯V1nV21V22⋯V2n⋮⋱Vm1Vm2⋯Vmn,式中m和n分别为经度与纬度最大值与最小值的差乘以104取整.因此,每个位置都与实际路网结构相对应,将其输入神经网络就能学习到路网结构.1.2 改进胶囊网络CapsNet使用矢量形式胶囊替换了传统标量形式的神经元,能够表达出更多空间信息[7];因此,CapsNet可以有效地识别到路网中交错的道路,使用输出胶囊中的矢量信息表达这种空间关系[8].另一方面,CapsNet使用动态路由算法替换了CNN中的池化层,可以有效避免道路空间关系的丢失.由于交通流数据有很强的波动性,并且包含一些数据噪声,因此本研究将胶囊网络的大卷积核替换为三次小卷积核用于提取空间特征,这样更有利于过滤数据噪声的干扰,充分学习各个路网之间的关联.通过三个卷积层之后,输入矩阵的空间特征被有效提取,再通过主胶囊层和中间胶囊层进行数据压缩,完成交通流数据的空间特征的提取.模型结构如图2所示,包含三个卷积层、初级胶囊层和高级胶囊层.10.13245/j.hust.220409.F002图2改进胶囊网络结构图经过改进的胶囊网络模型各层参数设置如下.a. 卷积层1.先将输入的矩阵X使用128个5×5的卷积核进行卷积,步长为2,使用Relu激活函数.b. 卷积层2.对ReluConv1初步提取的特征使用256个3×3的卷积核进行卷积,步长为2,使用Relu激活函数.c. 卷积层3.对ReluConv2提取的特征使用256个3×3的卷积核进行卷积,步长为1,使用Relu激活函数.d. 初级胶囊层.将卷积提取到的特征矢量化.其中包含一个步长为2的9×9的卷积核,胶囊尺寸大小为16,包含16个维度的信息.矢量形式的胶囊使用Squash作为激活函数,并将胶囊大小压缩至0~1之间,但方向不变.经过初级胶囊层得到初级特征Ui,该特征为1×16.Squash激活函数的公式为Dj=Ij||Ij||2/[(||Ij||2+1)||Ij||],式中:Ij为第j个胶囊的输入;Dj为第j个胶囊的输出.初级胶囊层得到的初级特征Ui与各胶囊层之间的权重关系Wij相乘来进行姿态转换得到预测的高级特征,即Uij'=WijUi.e. 高级胶囊层.对通过姿态转换得到的高级特征使用动态路由算法得到每个特征的耦合系数Cij,将所有高级特征的加权和保存到高级胶囊中完成特征提取,计算公式为Sj=∑iCijUij'.设置高级胶囊20个,St为每个t时刻的20个胶囊Sj的集合.1.3 注意力机制注意力机制通过对胶囊网络输出向量集合St加入近期交通流数据以生成注意力权重矩阵,对路网道路进行自适应关注.计算公式为Mt=Stq;(1)αt=softmax(WMt);(2)At=αtSt,(3)式中:q和W为可训练矩阵;Mt为t时刻的注意力分值;αt为注意力权重;At为注意力机制的输出.式(1)用于计算t时刻的Mt,式(2)对Mt使用softmax函数进行归一化得到αt;式(3)完成近期交通流数据路网拓扑信息的提取.1.4 GRU模型GRU是LSTM的一种变体,它将LSTM的输入门、遗忘门和输出门简化为更新门和重置门,相较LSTM具有更少的参数和更简单的结构,更容易进行训练,能很大程度提高训练效率.GRU的模型结构如图3所示,图中:Rt和Zt分别为重置门和更新门;ht和ht-1分别为t时刻和t-1时刻GRU的输出;ĥt为重置后的数据;σ为sigmoid激活函数;“.”为点乘;“,”为横向拼接;“+”为矩阵相加;“∗”为矩阵乘法;tanh为tanh激活函数.10.13245/j.hust.220409.F003图3GRU网络结构图GRU将含有注意力权重的数据At通过公式计算出预测结果yt,计算公式为Rt=σ(W1⋅[ht-1,At]);Zt=σ(W2⋅[ht-1,At]);ĥt=tanh(W3⋅[Rt*ht-1,At]);ht=(1-Zt)*ht-1+Zt*ĥt;yt=σ(W4⋅ht),式中W1,W2,W3和W4为可训练参数.重置门与更新门相结合用于捕获交通流的长短期信息.本研究将At输入到GRU中来捕获交通流在时间序列的连续变化,进行组合模型的短时交通流预测.1.5 组合预测模型构建在组合模型中,本研究将CapsNet和GRU与注意力机制结合,首先将CapsNet的输出向量输入到注意力模型中学习城市路网近期交通流的变化,进行自适应的关注,并将结果作为输入传递到GRU中.组合模型结构如图4所示.组合模型使用滑动窗口预测法进行预测,设置窗口为4,用前4个时刻的数据预测下一时刻,Attention用于获取CapsNet两个连续时刻的时空特征.在模型末尾加入一个全连接层,用于获取52条道路的预测,并输出最终预测结果.10.13245/j.hust.220409.F004图4预测模型结构图2 实验参数设置2.1 实验数据为了验证模型的有效性,在公开的数据集上进行实验验证.数据集选取滴滴出行“盖亚”数据开放计划(https://gaia.didichuxing.com)中2018年1~12月的西安市的城市交通指数数据集.该数据集包含道路名称、监测时刻、TTI(旅行时间指数)、平均行驶速度、道路的几何范围等五个字段.其中TTI是业内使用较多的城市拥堵程度的评价指标,其反应实际花费的行程时间与自由流花费行程时间的比值关系,值越大表示交通运行状态越差.这些交通流数据被处理成间隔为10 min的数据,供人们进行学习和研究.本研究选取西安市市区的52条道路,包括市区主干道路及十字路口,其路网拓扑图如图5所示.将交通流数据处理为10 min间隔的190×315的矩阵.本研究使用2018年1月份共31 d数据进行研究,将1月1号到1月24号共24 d作为训练集,1月25号到1月31号共7 d作为测试集.10.13245/j.hust.220409.F005图5路网拓扑图2.2 评价指标本研究使用交通流预测中最常用的误差指标均方根误差(ERMSE)、平均绝对误差(EMAE)和平均绝对百分比误差(EMAPE)来进行短时交通流模型预测效果的验证,有EMAE=1N1∑tYpred(t)-Ytrue(t);EMAPE=1N1∑tYpred(t)-Ytrue(t)Ytrue(t)×100%;ERMSE=1N1∑t(Ypred(t)-Ytrue(t))2,式中:Ypred(t)为t时刻的预测值;Ytrue(t)为t时刻的实际值;N1为样本总数.误差值越小说明模型预测效果越好.2.3 参数设置模型输入共有3个维度,前两个维度表示路网的长和宽(即经纬度),第三个维度表示路网中每个坐标点的速度值.通过多次实验对比,最终选取Adam作为组合模型的优化器,批处理数量(batch_size)设为16,学习率设置为0.000 5,并加入Dropout层和使用早停法来防止模型过拟合.为了使模型有更好的预测效果,采用五折交叉验证法来进行模型的训练,每次训练时将训练集随机分为五份,选取其中四份用于训练模型,剩下的一份用于检验模型.基线模型使用CNN,CapsNet和改进CapsNet来进行对比,同时与文献[8]中CapsNet-NLSTM组合模型进行对比.CNN使用四个卷积层,并在每个卷积层之后加入池化层,为了防止过拟合在模型最后加入Dropout层.CapsNet使用文献[7]中的结构及参数设置.改进CapsNet使用本研究提出的结构及参数设置.CapsNet-NLSTM使用文献[8]中的结构及参数设置.消融实验的模型与本研究所提模型参数设置相同.3 实验结果分析3.1 改进CapsNet效果验证本研究将改进CapsNet与CapsNet模型进行比较,实验结果如表1所示,表中T为模型每轮的平均训练时间.10.13245/j.hust.220409.T001表1改进CapsNet性能对比模型ERMSEEMAPE/%T/sCapsNet3.1011.563 236改进CapsNet2.9210.821 785由表1可知:本文改进CapsNet相较于CapsNet预测精度更高,说明可以有效降低交通流数据噪声干扰从而提升模型预测效果.另一方面使用三个小卷积核替代大卷积核降低了模型参数和复杂度,使每轮的平均训练时间降低44.83%.3.2 模型预测结果分析本研究将提出的ACapsGRU与CNN,CapsNet,改进CapsNet和CapsNet-NLSTM等模型进行对比分析;为了进一步验证模型的可行性,根据文献[12]将交通流分为畅通(速度大于25 km/h),缓慢(介于10~25 km/h)和拥堵(速度小于10 km/h)三种状态,并进行预测效果讨论.表2为模型与其它模型的预测性能对比表.本文提出模型的预测结果相较于CNN的ERMSE降低了12.57%,EMAPE降低了14.87%,EMAE降低了17.08%;相较于CapsNet的ERMSE降低了10.32%,EMAPE降低了12.37%,EMAE降低了13.85%;相较于改进CapsNet的ERMSE降低了4.79%,EMAPE降低了6.37%,EMAE降低了5.23%;相较于CapsNet-NLSTM的ERMSE降低了3.8%,EMAPE降低了2.96%,EMAE降低了4.78%.10.13245/j.hust.220409.T002表2模型预测性能比较模型ERMSEEMAPE/%EMAECNN3.1811.902.40CapsNet3.1011.562.31改进CapsNet2.9210.822.10CapsNet-NLSTM2.8910.442.09ACapsGRU2.7810.131.99表3为模型在不同交通状态下的性能对比表.当交通流处于拥堵状态时五个模型预测效果都比较差,由于拥堵具有很强的随机性和偶然性,可能会受到天气、交通事故等因素的影响,因此模型的预测效果较差;当交通流处于缓慢状态时,本文模型与CapsNet-NLSTM模型都有较好的预测效果;当交通流处于处于畅通状态时,本文模型的预测效果最好.综上所述可知:本文模型在交通流处于缓慢和畅通状态时具有更精确的预测效果,但在拥堵状态下的交通流由于具有很强的偶然性导致预测效果不够理想.10.13245/j.hust.220409.T003表3模型在不同交通状态下的性能对比模型拥堵缓慢畅通EMAPE/%EMAEERMSEEMAPE/%EMAEERMSEEMAPE/%EMAEERMSECNN118.966.658.3212.992.413.167.422.272.95CapsNet121.156.748.3612.582.333.097.112.172.84改进CapsNet145.627.819.1411.242.062.786.451.992.72CapsNet-NLSTM124.966.798.3110.661.962.676.922.142.89ACapsGRU120.226.598.1510.791.972.706.141.892.57为了更直观地展示模型的预测效果,随机选取一条道路前三天的预测值,共432条数据,针对五个模型的预测结果分别绘制折线图,如图6所示.10.13245/j.hust.220409.F006图6交通流预测对比图可以看出:本研究提出的ACapsGRU组合模型的预测结果最贴近真实数据,能较好地拟合出路网中交通流量的变化趋势,对于波动较大的交通流量也能有较好的拟合效果.CapsNet-NLSTM与本文模型拟合效果较为接近;但是CNN和CapsNet等基线模型不能对变化明显的交通流量波动进行有效预测,因此拟合效果较差.3.3 ACapsGRU模型多步预测性能探究对本文模型在多步预测方面的性能表现进行研究,预测步长选取1,3,5,7步,分别对应时间10,30,50,70 min.模型的性能如表4所示.10.13245/j.hust.220409.T004表4ACapsGRU多步预测性能比较预测步长ERMSEEMAPE/%EMAE12.7810.131.9932.8610.252.0553.7614.432.8974.5718.303.69实验结果表明模型的预测精度随着模型预测步长的增加而降低.这是由于预测步长的增加使得历史数据的可用信息减少,导致模型预测精度降低;因此,本模型仅适用于短时交通流预测,对于中长时的交通流预测还有待改进.3.4 消融实验为了验证模型中各个模块的有效性,对本文模型做消融实验以分析CapsNet,GRU和注意力机制对组合模型的影响.其中:AGRU模型是在ACapsGRU模型的基础上去掉CapsNet层;CapsGRU是在ACapsGRU模型的基础上去掉注意力机制层;ACaps是在ACapsGRU模型的基础上去掉GRU层.另一方面,为了分析GRU相较LSTM的优越性,构建了ACapsLSTM模型进行对比分析.实验结果如表5所示.10.13245/j.hust.220409.T005表5模型预测性能比较ModelERMSEEMAPE/%EMAEACapsGRU2.7810.131.99AGRU5.6820.654.32CapsGRU3.1711.792.43ACaps3.7014.972.87ACapsLSTM2.9510.802.18由表5可知:本文ACapsGRU模型的各个误差指标最小,说明每个模块对于组合模型的预测结果都有一定作用,因此组合后会有更好的预测性能.CapsNet能够有效提取复杂道路的路网特征,因此ACapsGRU的预测效果好于AGRU;通过对比ACapsGRU和CapsGRU可以发现注意力机制可以对近期交通流数据进行自适应关注,使得模型对于重要性强的交通流数据分配更高的权重,从而提升预测效果;ACaps的预测效果比ACapsGRU更差是因为GRU可以对交通流数据的时间特性进行学习以达到更精确的预测效果.ACapsGRU相较ACapsLSTM也有更低的预测误差.因此,本研究提出的ACapsGRU组合模型通过将Attention,CapsNet和GRU神经网络进行结合,适用于短时交通流预测研究,同时达到较高的预测精度.4 结语本研究提出了一种ACapsGRU的深度学习方法用于处理复杂城市路网道路拓扑结构,并进行短时交通流预测.实验结果表明:本文模型可以有效学习路网之间的复杂空间关系,并提升短时交通流预测精度,预测精度优于CNN与CapsNet及CapsNet-NLSTM模型.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读