建立成熟的智能交通系统(ITS)是现代交通研究领域的研究热门[1]。交通流量预测在交通管理及城市规划中应用广泛。研究人员提出许多基于交通网络信息的模型,建立时间序列模型并开发路网节点的空间关系,如卡尔曼滤波模型、统计学模型及人工智能方法。图卷积网络(GCN)将不规则交通数据之间的关系以图的形式展现[2]。目前,时空图建模的研究方向主要有两个,分别为将图卷积网络(GCN)集成到递归神经网络(RNN)中或卷积网络(CNN)中。为了利用交通数据的复杂且不稳定的变化特征,可以提出一种基于时空图卷积网络(ASTGCN)[3]的注意力机制,构建一种基于图的动态拉普拉斯矩阵,每个输入序列的数据均由空间注意力机制产生。ASTGCN模型过滤路网中的某些信息元素,忽略相邻周期拉普拉斯矩阵间的内在时间联系。文章提出一种用于交通流量预测的时空动态图卷积网络(STDGCN)模型,在STDGCN模型中引入拉普拉斯矩阵隐藏网络(LMLNS)[4],自适应地反映时空关系。LMLNS网络将时空关系反馈给GCN网络,形成一种时空动态图卷积网络,利用隐藏时空特征进行交通流量预测。1研究现状和STDGCN模型网络结构1.1交通流量预测定义第i个道路节点在t时刻的输入数据为xti∈RF,F为xti的特征尺寸,F=3,代表模型采用三种不同类型的道路交通数据,如交通流量、平均行驶速度等。路网在t时刻的交通数据为Xt=…,xti,…,i=1,…,N,N表示路段的数量。运用T2时间输入的交通数据可以预测未来T1时间内的交通流量,其动态窗口的长度为T2。目前,研究人员通过深度学习方法处理交通预测问题[5],大部分研究基于CNN或RNN模型,如长短时记忆(LSTM)模型、门控循环(GRU)模型等。1.2图卷积网络GCN模型能够在谱域中处理不规则图形数据[2]。对于图形结构G的输入数据x,可知GCN算子gθåG的运行算法:gθåGx=gθLx=UgθΛUTx (1)式中:gθ——GCN模型可训练参数;L=UΛUT;U——G的傅里叶基;Λ=diagλ1,…,λN∈RN×N。拉普拉斯矩阵L分解计算具有复杂性,因此研究人员提出Fast-GCN模型[6]。GCN已被运用至许多方面,如利用时空图卷积网络(STGCN)模型进行动作识别。在交通预测领域,图卷积递归网络(GCRN)、门控时空图卷积网络(Gated-STGCN)、ASTGCN模型利用空间注意力机制深度学习动态图矩阵[3],利用S'定义动态矩阵。1.3注意力机制学习相关信息之间具有广泛依赖性,可以在自动编码、深度卷积和网络生成过程中引入注意力机制。自注意力机制可以揭示输入信息或特征之间的相互依赖性[7-8]。与自注意力机制相比,其他注意力方法通过加权矩阵独立地计算不同特征间的关系。图注意力网络(GAT)首次提出注意力机制,神经网络(NN)通过自适应地学习图动态邻接矩阵,在半监督任务中获得高效表现。2研究方法绘制某一时刻STDGCN模型的单元图,基于LMLNS隐藏网络和时空单元的动态图卷积网络如图1所示。10.19301/j.cnki.zncs.2022.01.001.F001图1基于LMLNS隐藏网络和时空单元的动态图卷积网络注:⊗为哈达玛积;L̃为路网拉普拉斯矩阵;Lres为全局拉普拉斯矩阵;Lp为根据当前交通数据估算的拉普拉斯矩阵。为了探究周期时间数据对交通预测任务的影响,STDGCN模型对三个不同的时间周期进行采样,采样得到三个时间周期的交通流数据构成STDGCN模型的输入数据。近期数据使用XTh表示;日周期数据使用XTd表示;周周期数据使用XTw表示。提取STDGCN模型时空特征结构有两个主要部分,拉普拉斯矩阵隐藏网络部分(图1右部)估算观测交通数据的拉普拉斯矩阵;基于GCN网络的交通流量预测部分(图1左部)利用图卷积网络获取观测交通数据的时空特征。2.1拉普拉斯矩阵隐藏网络LMLNS中,由全局拉普拉斯矩阵学习层处理高速公路路网拉普拉斯矩阵L˜,将输出的全局拉普拉斯矩阵转移至几个拉普拉斯矩阵预测单元中,将动态拉普拉斯矩阵Lp传输至时间图卷积层(GTCL)。(1)全局拉普拉斯矩阵学习层。全局拉普拉斯矩阵学习层具有与参数化全局共享拉普拉斯矩阵的类似功能[9]。研究人员利用腌膜法[9]生成新的拉普拉斯矩阵LMask。LMask中,即Lr中零值位置的连接容易被忽略。使用1-hop残差全局拉普拉斯矩阵[4],使用Lres1表示参数化拉普拉斯矩阵,Dresii表示节点i的度矩阵,Dres表示度矩阵的逆矩阵,度矩阵加上0.000 1以避免出现数据缺失等问题。(2)特征采样。观察近期、日周期和周周期的交通数据,整合特征联系。将除近期T特征外的所有T长度特征融合为一个新特征,经过采样特征的尺寸变化,为拉普拉斯矩阵预测单元提供新的输入特征,第一个k-1特征和最后的T特征分别转移至两个不同的空间注意力模块。(3)空间注意力机制。采用注意力机制[8]估算高速公路路网当前周期的自适应邻接矩阵L⃗d[10],构建每个时刻高速公路路网的空间关系。使用矩阵内积作为高速公路路网邻接矩阵的估算方法。采用多头注意力结构探索更多节点之间的关系。STDGCN模型中,一个输入特征生成邻接矩阵的序列,其他特征生成自适应邻接矩阵的序列,结合这两个序列作为空间注意力模块的输出。(4)长短时记忆单元。为了探索邻接矩阵L⃗d序列之间的内在关系,采用长短时记忆单元即LSTM单元学习时间相关性[4]。从长短时记忆单元中得到一个未来邻接矩阵,结合全局拉普拉斯矩阵Lres,输出拉普拉斯矩阵预测网络Lp。Lp会被转移至GCN部分的GTCL。2.2基于GCN网络的交通流量预测基于GCN的交通流量预测模型STDGCN具有以下四个模块,被收缩以提取输入交通数据的时空特征。(1)时间卷积层(TCL)。TCL从原始交通流量数据中提取高维局部时间信息。其中Conv1×ts为二维卷积算子,内核尺寸为1×ts。(2)时间图卷积层(GTCL)。在交通流量预测领域中,GTCL可以基于GCN网络[3]实现。将GCN和TCL层堆叠为时空模块,从TCL层的输出中提取时空特征TC[4]。使用门控机制[11]探索局部时间特征,根据动态拉普拉斯矩阵Lp得出GTCL层的最终结果。(3)时间注意力机制。采用时间注意力机制自适应地获取交通数据的大跨度时间相关性,获取不连续时间段之间相关性的掩膜矩阵,使不连续时间段之间的关系值为零。(4)批归一化。基于GCN的交通流量预测的激活函数,利用批归一化Leaky_Relu·激活时间注意力机制的输出特征。2.3损失函数经过STDGCN模型的处理,得到输出的空间和时间特征,在此基础上建立输出层并构造STDGCN模型的损失函数。近期交通数据是连续的,其长度为i×T。日周期和周周期采样数据被长度为T的k-1单元分割。将所有卷积输出相加作为STDGCN模型的预测值,采用l2_loss计算交通流量预测值与其真实交通流量间的差值[4],获得STDGCN模型的损失函数。loss=l2_lossprediction,truth (2)3试验设置3.1数据集在交通流量预测试验中,使用郑州市绕城高速公路交通数据集和重庆市绕城高速公路交通数据集(以下简称HighwayZZ和HighwayCQ)预测高速公路不同时间间隔的交通流量,数据均由高速公路预埋线圈传感器收集。HighwayZZ数据集的获取位置位于平原城市郑州市的绕城高速公路,HighwayCQ数据集的获取位置位于山地城市重庆市的绕城高速公路,两个获取位置的地形和公路线形存在较大差异。运用STDGCN模型在这两个交通数据集上进行交通流量预测试验可以证明模型在平原城市和山地城市高速公路中的普适性。HighwayZZ数据集记录郑州市绕城高速280个高速公路线圈传感器收集的从2020年10月~2020年11月的交通流数据。HighwayCQ记录重庆市绕城高速160个高速公路线圈传感器收集的从2020年10月~2020年11月的交通流数据。交通流数据集的采样间隔均为1 min,通过重采样将采样时间间隔变为5 min,交通流数据集均包含三种交通要素,分别为交通流量、平均速度、交通密度,F=3。数据集每小时增加12个数据样本,T=12。将HighwayZZ和HighwayCQ划分成三部分,分别为训练集、验证集、测试集,其占比分别为60%、20%、20%。两个交通数据集的详细划分如表1所示。10.19301/j.cnki.zncs.2022.01.001.T001表1两个交通数据集的详细划分数据集训练集验证集测试集比例/%数量比例/%数量比例/%数量HighwayZZ607 086202 362202 362HighwayCQ607 800202 600202 600在验证集上选择最佳的模型参数,在测试集上评估所运用模型的性能。路段数据样本通过x'=x-meanxstdx进行标准化。3.2参数设置各种模型均在Pytorch 1.2.0 & Python 3.6环境下运行,计算机平台参数为8G显存Nvidia GeForce GTX960 GPU显卡和Intel(R)Xeon(R)E3-1231 v3 CPU,计算机操作系统为Windows7。在GTCL层中设置切比雪夫多项式的阶为M=3,时间内核大小ts=3,多头注意力数量设置为K=4。基于GCN网络的STDGCN模型进行交通流量预测输出数据集的特征值大小为64。三种交通数据时段的长度和ASTGCN模型相同,分别为Th=24、Td=12、Tw=24。未来一小时内预测时间间隔Tp=12。试验采用60个样本进行训练,在未来一小时内对12个样本进行预测。试验数据的批尺寸(Batch_size)为16,采用Adam方法优化,运用l2_loss作为模型的损失函数。模型在训练阶段训练40个epoch,初始学习率为0.000 5,epoch学习衰减率为0.92。3.3方法比较将STDGCN模型与多种交通流量预测模型进行对比,包括LSTM、GRU、GCRN、STGCN、ASTGCN。ASTGCN模型使用采样的交通数据作为输入特征,其他模型使用近期交通数据进行交通流量预测。为了估测不同输入数据的影响,使用近期数据制作一个模型,由STDGCN_R表示。为了评估基于GCN网络的不同拉普拉斯矩阵的预测效率,尤其是图注意力(GAT)模型,比较基于GCN的四种不同模型。ASTGCN模型[3]运用注意力机制拉普拉斯矩阵;STDGCN_Mask模型使用掩膜拉普拉斯矩阵对STDGCN模型进行相应变化;STDGCN_Res模型使用残差拉普拉斯矩阵对STDGCN模型进行改变;STDGCN_GAT模型是一种利用GAT替换模型空间特征层即GTCL层的方法模型。模型的性能均能够使用三个指标衡量,分别为均方根误差(RMSE)、平均绝对百分比误差(MAPE)和平均绝对误差(MAE)。MAE=∑i=1Tp∑j=1NXij-X̂ijTp×N (3)MAPE=100%Tp×N∑i=1Tp∑j=1NXij-X̂ijXij (4)RMSE=∑i=1Tp∑j=1NXij-X̂ij2Tp×N (5)4结果分析不同模型在HighwayZZ数据集上的交通流量预测结果如表2所示。不同模型在HighwayCQ数据集上的交通流量预测结果如表3所示。10.19301/j.cnki.zncs.2022.01.001.T002表2不同模型在HighwayZZ数据集上对不同时间交通流量的预测结果模型15 min30 min60 minMAERMSEMAPEMAERMSEMAPEMAERMSEMAPELSTM23.5335.7318.6825.1338.0520.3128.9743.4424.87ASTGCN20.3131.9015.1620.6532.6215.1521.4334.0915.44STGCN22.2033.1019.1423.9135.6320.4427.5440.9223.61GCRN22.3633.6617.5923.2034.8718.2925.3837.9420.37GRU23.6636.2919.3025.2738.5520.8429.2144.0425.21STDGCN_GAT20.2032.3114.7920.4632.8114.8721.0533.7515.23STDGCN_Mask19.9331.3314.7920.3232.1114.9020.9833.3215.20STDGCN_R19.9231.1014.0220.1831.6613.9920.8232.7514.31STDGCN18.8029.7414.3319.1930.5114.5319.7431.5814.7510.19301/j.cnki.zncs.2022.01.001.T003表3不同模型在HighwayCQ数据集上对不同时间交通流量的预测结果模型15 min30 min60 minMAERMSEMAPEMAERMSEMAPEMAERMSEMAPELSTM18.3728.4213.7719.6830.4915.2822.9035.1619.42ASTGCN16.8125.1811.2717.0725.8011.4117.7927.1711.88STGCN17.4725.9513.0818.7428.1813.9921.4232.4916.17GCRN17.9626.5412.9218.3627.2613.1519.5329.1613.97GRU19.4029.8814.4520.6831.8815.6023.8636.5319.04STDGCN_GAT15.9924.7011.6616.1825.1311.7016.5425.9211.78STDGCN_Mask15.4623.7211.6915.7924.4311.8016.3025.4812.06STDGCN_R15.1722.8510.4515.5123.6010.6016.1824.8210.99STDGCN14.9522.9310.2315.1923.5510.3615.5624.4510.58STDGCN模型在所有指标上均具有较好的性能表现。LSTM模型和GRU模型性能较差,基于GCN网络的GCRN模型、STGCN模型的性能较LSTM和GRU模型具有明显的改善,受益于模型获取交通流数据时空特征的能力。ASTGCN模型指标在模型中排第三位,因为ASTGCN模型的自适应性和动态图拉普拉斯矩阵由经验拉普拉斯矩阵上的掩膜矩阵产生。与其他模型相比,STDGCN模型在HighwayZZ和HighwayCQ两个高速公路数据集上的预测精度提高10%~12%,隐藏拉普拉斯矩阵网络具有充分揭示交通数据内在关系的优势。STDGCN_R模型的指标在模型中排行第二,进一步证实LMLNS隐藏网络可以更好地利用高速公路路网的动态空间关系。与STDGCN模型相比,STDGCN_R模型验证输入更多周期性交通数据可以获得更好的交通流量预测精度。运用STDGCN模型进行交通流量预测得到的预测结果与线圈传感器记录的真实交通流量值更接近,STDGCN模型的预测精度比ASTGCN模型高。选取STDGCN模型与ASTGCN模型,分别在不同交通数据集上预测交通流量一个变化周期结果,进行对比。ASTGCN模型和STDGCN模型预测60 min交通流量结果对比如图2所示。图2ASTGCN模型和STDGCN模型预测60 min交通流量的结果10.19301/j.cnki.zncs.2022.01.001.F2a1(a)HighwayZZ数据集10.19301/j.cnki.zncs.2022.01.001.F2a2(b)HighwayCQ数据集进一步分析不同预测时间的交通流量预测精度,各种模型不同预测时间的预测误差结果如图3所示。图3各种模型不同预测时间的预测误差结果10.19301/j.cnki.zncs.2022.01.001.F3a1(a)HighwayZZ的MAE10.19301/j.cnki.zncs.2022.01.001.F3a2(b)HighwayZZ的RMSE10.19301/j.cnki.zncs.2022.01.001.F3a3(c)HighwayCQ的MAE10.19301/j.cnki.zncs.2022.01.001.F3a4(d)HighwayCQ的RMSE不同预测时间ASTGCN模型和STDGCN模型预测误差结果如图4所示。图4不同预测时间ASTGCN模型和STDGCN模型预测误差结果10.19301/j.cnki.zncs.2022.01.001.F4a1(a)HighwayZZ10.19301/j.cnki.zncs.2022.01.001.F4a2(b)HighwayCQ在交通流量预测试验中,STDGCN模型在不同预测时间上的MAE和RMSE指标值均低于其他模型,表明本文的方法在不同交通流量预测任务和不同预测时间中具有良好的鲁棒性。4.1不同拉普拉斯矩阵对GCN网络的影响使用基于GCN网络的模型对不同拉普拉斯矩阵进行交通流量预测试验,包括ASTGCN、STDGCN_Mask、STDGCN_Res、STDGCN_GAT和STDGCN模型。使用两种掩膜方法的模型,即ASTGCN和STDGCN_Mask模型的预测效果较差。试验结果解释了掩膜拉普拉斯矩阵表示交通数据复杂空间相关性的局限性。与ASTGCN模型相比,使用STDGCN_Mask模型可以获得更好的预测结果,验证STDGCN模型在不使用动态矩阵的情况下进行交通流量预测的有效性。STDGCN_Res模型在几乎不增加训练时间的情况下的预测精度优于ASTGCN和STDGCN_Mask模型,表明需要利用全局优化的残差拉普拉斯矩阵代替经验拉普拉斯矩阵,提高交通流量预测精度,验证该方法中全局拉普拉斯矩阵学习层的必要性。LMLNS可以为GCN网络构造一个有效的动态图拉普拉斯矩阵序列。STDGCN模型方法的MAE、MAPE和RMSE指标优于STDGCN_GAT模型,表明GTCL层优于原始的图注意力机制。拉普拉斯矩阵隐藏网络的复杂性增加。与其他方法相比,STDGCN模型的训练时间和测试时间有所增加,对于一般性实时应用,模型测试时间差异的影响可忽略不计。为了直观显示由本研究方法构造的动态拉普拉斯矩阵,绘制动态拉普拉斯矩阵序列的残差矩阵[4],将其与ASTGCN模型的残差矩阵进行比较。不同GCN模型在HighwayZZ和HighwayCQ数据集上的交通流量预测结果如表4所示。ASTGCN和STDGCN模型在两个数据集、三个时间间隔内的残差矩阵对比如图5所示。10.19301/j.cnki.zncs.2022.01.001.T004表4不同GCN模型在HighwayZZ和HighwayCQ数据集上的交通流量预测结果模型HighwayZZ/HighwayCQMAERMSEMAPE训练时间/s测试时间/sASTGCN21.43/17.7934.09/27.1715.44/11.88263.47/181.7126.30/14.53STDGCN_Mask20.98/16.3033.32/25.4815.20/12.06309.62/178.6531.99/17.47STDGCN_Res20.33/15.5932.65/24.6714.56/10.66313.17/179.3632.52/17.64STDGCN_GAT21.05/16.5433.75/25.9215.23/11.78288.61/178.5429.03/16.70STDGCN19.74/15.5631.58/24.4514.75/10.58673.19/309.0475.58/31.9710.19301/j.cnki.zncs.2022.01.001.F005图5ASTGCN和STDGCN模型在两个数据集、三个时间间隔内的残差矩阵对比在两个数据集上,随着时间间隔增加,残差矩阵变得更加明显。因为随着时间间隔的增加,交通数据的差异将变得更大,验证了STDGCN模型能够获取到交通数据时空相关性的变化。ASTGCN模型能够通过注意力机制自适应估算拉普拉斯矩阵,但其残差矩阵序列没有明显变化,其表示动态拉普拉斯矩阵的能力有限。STDGCN模型可以进一步探索拉普拉斯矩阵的隐藏变化。动态拉普拉斯矩阵隐藏网络(LMLNS)能够揭示不同路段观测交通动态数据之间的隐藏时空关系。4.2自适应邻接矩阵的作用分析根据STDGCN模型的预测,可以得到HighwayZZ和HighwayCQ数据集前50个高速公路节点的自适应邻接矩阵热力图[10]。通过Bigemap获取的谷歌地图数据,运用ArcGIS10.4.1软件操作平台,将HighwayZZ和HighwayCQ数据集部分高速公路交通流量节点在谷歌地图上的地理位置进行标记,最终得到可视化的节点信息。STDGCN模型预测得到HighwayZZ数据集的自适应邻接矩阵如图6所示。图6STDGCN模型预测得到HighwayZZ数据集的自适应邻接矩阵10.19301/j.cnki.zncs.2022.01.001.F6a1(a)前50个高速公路交通流量节点的自适应邻接矩阵热力图10.19301/j.cnki.zncs.2022.01.001.F6a2(b)部分高速公路交通流量节点在谷歌地图上标记的地理位置由图6(a)可知,一些列的高值点比其他列多,如第27、33、34、38、43列,表明HighwayZZ数据集前50个高速公路交通流量节点中,第27、33、34、38、43节点对高速公路大多数节点交通流量影响较大;第4、6列的高值点较少,表明HighwayZZ数据集前50个高速公路交通流量节点中,第4、6节点对高速公路大多数节点的交通流量影响较小。由图6(b)可知,第27、33、34、38、43节点位于HighwayZZ数据集多条高速公路的交叉口和U型口附近,第4、6节点位于单线高速公路上。STDGCN模型预测得到HighwayCQ数据集的自适应邻接矩阵如图7所示。图7STDGCN模型预测得到HighwayCQ数据集的自适应邻接矩阵10.19301/j.cnki.zncs.2022.01.001.F7a1(a)前50个高速公路交通流量节点的自适应邻接矩阵热力图10.19301/j.cnki.zncs.2022.01.001.F7a2(b)部分高速公路交通流量节点在谷歌地图上标记的地理位置由图7(a)可知,HighwayCQ数据集前50个高速公路交通流量节点中,第13、19、20、36、38节点对高速公路的大多数节点的交通流量影响较大,第11、24节点对高速公路的大多数节点的交通流量影响较小。由图7(b)可知,第13、19、20、36、38节点位于HighwayCQ数据集多条高速公路的交叉口和U型口附近,第11、24节点位于单线高速公路上。5结语STDGCN模型在预测精度方面的能力优于多种交通流量预测方法模型,STDGCN模型在平原城市和山地城市不同地形下不同线形的高速公路交通流量预测中均具有较高的预测精度。考虑STDGCN模型特别是LMLNS隐藏网络的复杂性,在未来的高速公路交通流量预测研究中,应该寻找一种更加快速有效的动态提取拉普拉斯矩阵的方法。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览