树人论文网一个专业的学术咨询网站!!!
树人论文网

一种时空周期性注意力网络的交通流量预测模型

来源: 树人论文网发表时间:2021-09-24
简要:摘 要:当车流较密集时,易出现车辆拥堵继而引发交通事故,精确的交通流量预测对交通安全很重要。针对道路交通流量拥有复杂的空间相关性和时间依赖性的特性,我们提出了一种时

  摘 要:当车流较密集时,易出现车辆拥堵继而引发交通事故,精确的交通流量预测对交通安全很重要。针对道路交通流量拥有复杂的空间相关性和时间依赖性的特性,我们提出了一种时空周期性注意力网络的交通流量预测模型(STPAN)。首先,使用 GCN 构造空间相关性。其次,综合短期和长期的周期性信息对车流量进行预测,并采用 LSTM 获得时序依赖关系。交通流量数据具有周期性,然而此数据序列的周期性非真正意义上的按日或按周的。针对此问题,我们提出了一个周期性注意力机制解决周期性时间变化。此外,还将外部信息增添到我们的模型中以提升模型的预测精度。最后我们在 PeMS 数据集上验证所提模型的有效性。

一种时空周期性注意力网络的交通流量预测模型

  王婧娟; 陈庆奎, 小型微型计算机系统 发表时间:2021-09-24

  关键词:交通预测;时空数据;注意力机制;神经网络

  1 引言

  因为交通拥堵等现象易引起交通事故,不利于交通安全,因此治理交通拥堵问题刻不容缓[1]。交通流量是辨别交通拥堵因素之一。精确的交通流量预测能为交通参与者提供参考。人们可根据交通流预测信息提前规划出行计划,避开拥堵路段,缩减出行时间。精确的交通流量预测也作为交通安全的一部分[2]。

  交通流量会随着时间和空间的变化而变化,交通流具有以下显著特征:

  1. 随机性。因为道路上的各种车辆随机决定路径另有外界环境的种种因素的影响和干扰,呈现出剧烈的随机特征。

  2. 周期性。一周有 7 天,包含 5 天工作日和 2 天周末,人们的驾驶外出也展现出规律性。对于交通流量,相同路段的交通流量表现出周期性的通畅、拥挤等现象,并且相同路段每隔一段时间,交通流状态呈现出重复性。

  3. 时空特性。下一时刻的交通流受之前交通流的影响,即历史交通流量对现在和将来的交通流量有影响,且邻近路段的交通流间也会相互影响[3]。

  4. 网状特性。道路间纵横交错,比如城市的关键交通枢纽靠主干道彼此连接,其它小路段利用辅助交通路线连接至主干道,而驾驶人依照各自的出行经验或使用不同的导航系统选取不同的驾驶路径,致使整个路网像一个错综复杂的网络。

  综上所述,交通网络受各类因素影响,不同时段、不同道路的交通流间相互关联、彼此作用,且显示出不确定性和复杂性,难以准确预测交通流量。交通预测不单能为交通管理员提早觉察交通状态,且能为我们提供较合理的路线、提升交通效率。但是因为其复杂的时间和空间依赖性,使得交通流预测成为一项难题。

  针对交通流量的空间相关性和时间依赖性的特征,我们提出了基于时空周期性注意力网络的交通流量预测模型 (STPAN)。首先,使用 GCN 构造空间相关性。其次,综合考虑短期和长期的周期性信息对流量进行预测,并采用 LSTM 获取时序依赖关系。因为时间周期性非真正意义上的周期,因此我们利用周期性注意力机制来解决此问题。此外,还将天气等外部因素增添到模型中,以提升模型的预测精度。最后我们在 PeMS 数据集上验证了所提出的模型的有效性。

  2 相关工作

  深度学习模型能学习到更复杂的特征,可以有效解决一些难题。现在深度神经网络在各个行业各个领域均被广泛使用。目前大量研究人员将深度学习模型引入到交通预测问题中。

  文献[4]构造了基于数据驱动的城市路网短期交通流预测模型。该模型先将时间序列划分为趋势序列和残差序列。对这两个时间序列重构后,进行了基于 LSTM-RNN 的模型训练和预测。然后,将这两个结果组合在一起,产生最后的预测。最后用两个城市道路网对模型进行评价。结果显示,数据处理模块增强了模型的鲁棒性。但 LSTM 和 RNN 存在梯度弥散和梯度爆炸问题。

  文献[5]提出了基于 DNN 的交通预测模型(DNN-BTF),该模型运用交通流的周期性和时空特性以及注意力机制,可以自动学习历史交通流量的重要特征。使用 CNN 模型提取交通流的空间特征,使用 RNN 提取交通流的时间特征。虽然 CNN 可以有效的提取网格数据的空间特征,但不适合图结构的时空数据的特征描述和时空相关性分析。

  文献[6]提出了基于图像的交通速度预测模型,可以自动学习抽象的时空交通特征来提取时空关系。此方法分为两大步骤。第一,将路网流量变换成图像,此图像将交通网络的时间和空间维度分别作为图像的两个维度。因为相邻路段在图像中也是邻近的,因此能够保存时空信息。第二,使用基于 CNN 的深度网络模型对此图像进行交通预测。但 CNN 无法直接处理路网结构。

  文 献 [7] 提 出 了 基 于 误 差 反 馈 递 归 卷 积 神 经 网 络 (eRCNN)进行车速预测。将相邻道路的时空车速视为输入矩阵,eRCNN 运用相邻路段间的隐含相关性来提升模型的预测精度。最后对北京市二三环出租车的真实数据进行大量实验,验证了 eRCNN 模型的优秀的预测能力,但模型并没有考虑道路的交通流方向。

  文献[8]使用 GCN 与 GRU 组合模型用于高速公路和出租车数据集进行车速的预测,且加入噪声验证模型的鲁棒性,结果显示此模型达到较好的性能。但此模型未考虑到路网内交通流之间的特性。

  文献[9]根据最小二乘支持向量机提出了一种改进型的灰狼优化算法进行交通流量预测。为避免陷入局部最优,设计了灰狼优化算法内部的交叉、变异和选择操作,提升了算法的搜索性能。但此文献并没有考虑外部特征对模型的影响。

  文献[10]构造了基于关键路段的混合卷积长短期记忆神经网络模型(CRS-ConvLSTM NN)来估计未来的交通变化。首先根据时空相关算法鉴别出对子网络影响最大的关键路段。然后,将关键路段的交通速度当作 ConvLSTM 的输入来预测整个网络的将来的交通状态。实验结果验证了 CRS-ConvLSTM 模型在不同关键路段下的预测能力。 但该文献没有考虑周期特性和外部环境信息。

  文献[11]提出了 DCRNN(扩散卷积循环网络),分别采用扩散卷积和循环网络在有向图上捕获交通流的空间和时间依赖性,结果表明该模型具有良好的预测精度。文献[12]提出了 STGCN(时空图卷积网络),可以提取时空特征且捕捉空间的依赖关系。但文献[11]和文献[12]均没有考虑周期特性和外部环境信息。

  综上所述,有些方法在建模时没有同时考虑空间依赖和时间依赖,还有些研究忽略了时间序列预测中的长期周期性影响。交通数据具有周期性,但交通数据的周期性非真正意义上的按日或按周的。因此,我们构造一个周期性注意力机制来解决周期性时间变化问题。

  3 基本概念

  在本小节中,我们先描述研究过程中使用的基本理论,以及研究问题的定义。

  定义 1:道路网络拓扑 G 。我们按照行驶方向用有向图 G V L ( , ) 刻画道路网络的拓扑结构,把每个传感器当作图中的一个节点,其中, 1 2 ={ , , , } N V v v v 是一组传感器节点, L 表示路段, A 是道路的邻接矩阵描述道路间的连接关系。邻接矩阵 A 仅包含两个元素,即 0 和 1,如公式(1)所示。 1, and are connected ( , ) 0, otherw ise i j l l A i j   (1)

  定义 2:交通流量。交通流量是指在一定时间段内途经某个地点的车辆的个数,其随时间的推移构成时间序列,且具备嵌入在连续空间中的空间属性。交通流量的计算公式见公式(2)所示。交通流量预测是一个典型的时空数据预测问题。 N x T  (2) 其中, x 是交通流量, T 是观测时间, N 是在观察时间内经过的车辆个数。

  在路段 ( ) i i l l L 的第 th t 个时间间隔(比如 5 分钟)处的流量被定义为该路段在该时间间隔期间的车辆的平均流量,用 it, x 表示。将在第 th t 个时间间隔的道路网络的流量定义为向量 t X ,其中第 th i 个元素是 , ( )t i i t X x  。

  问题表述:交通流量预测的目标是利用一系列的历史交通流量数据对各路段的将来流量值进行预测。具体来说,给定先前 p T 时间步长的历史流量记录 1 { , , } p t T t X X   ,目标是预测未来 F T 时间步的交通流量 F t T X 。交通流量预测问题可当作是描述将历史流量数据映射到未来流量数据的非线性映射函数 f ,如公式(3)所示: 1 ({ , , }, ) F p t T t T t X f X X G    (3)

  4 空间相关性建模

  获取复杂的空间依赖性是交通预测中的重要难题。传统的卷积神经网络(CNN)能获取局部空间特征,但 CNN 限于处理欧式数据(如图像,语音等)。城市道路网是非欧几里得拓扑图,这表明 CNN 模型不能描述城市道路网的复杂拓扑结构,因此不可以正确地捕捉道路网的空间相关性。GCN 用于提取基于图的数据的空间相关性。空间相关性的提取过程对应于框架图 2 中的 a 部分。

  首先,我们定义了道路网络拓扑 G V L  ( , ) 上的空间卷积。在道路网络拓扑的背景下,我们将每个路段 i l L 的 K 跳邻域定义为 ( ) { | ( , ) } i j i j K l L d l l K   ,其中 ( , ) i j d l l 表示从 i l 到 j l 的所有路线中最小数目的路线。通常,邻接矩阵是一跳邻域矩阵 A , K 跳邻域矩阵可以通过计算 A 的 K 次幂得到。我们将对角线元素添加到邻域矩阵,其定义为: Ci( ) K k G A A I   (4) 其中, C i( ) 是矩阵的 clip 函数,目的是将每个非零元素修改为 1。 1, ( ) ( , ) 0 , K j i G l K or i j A i j otherw ise     (5) 图 1 显示了道路网络中 [ ] K G A i 的一跳和二跳的示例图,其中路段 i 以黑粗实线表示,相邻路段以黑虚线表示。

  根据上述邻域矩阵,图卷积的简明形式可以定义如下: ( ) ( ) K t G G t X K W A X   (6) 其中, WG 是与 A 大小相同的权重矩阵。运算符 是 Hadamard 积。通过 K W A G G 运算,将生成一个新的矩阵,该矩阵的 K 跳邻居位置上有可训练的参数,其余位置上的参数为零。因此, ( ) K W A X G G t  被认为是 t X 的空间离散卷积, ( ) t X K 是时间 t 处的空间融合的向量。它的第 th i 个元素 , ( ) i t x K 表示包含 ( ) i K 中所有相邻路段信息的时间 t 处的路段 i l L 的空间融合信息。

  为了使并行计算更加适用和灵活,将公式(6)分解为一维卷积得到公式(7)。 T , ( ) ( [ ] [ ]) K i t G G t x K W i A i X   (7) 其中, [ ] W i G 和 [ ] K G A i 分别是 WG 和 K G A 的第 i 行。

  5 时间依赖性建模

  很多文献仅将前几个时间间隔(往往是几个小时)进行流量预测。而这些方法忽视了长期相关性(如周期性),周期性也被视为时空预测问题的一个重要特征[13]。交通数据在时空相关性上表现出周期性变化,在本小节,不但考虑短期信息,也将考虑长期的周期信息。

  经过第 4 节提取数据的空间特征后,接着使用 LSTM 来获得时间序列依赖关系。本文使用文献[14]中的 LSTM 版本。我们还选取天气信息特征一同输入进 LSTM,此等同于对输入 LSTM 的数据增添一维特征,继而对道路上的交通流量进行预测。交通数据随时间和空间的改变而不断改变,呈现出强烈的不确定性和复杂性,所以在交通预测中,需考虑这些复杂性和不确定性对预测结果的影响。

  其中, it, h 是时间 t 处路段 i 的输出表示。 it, e 表示外部变量 (如天气)。因此, it, h 包含空间和短期时间信息。此方法仅使用了与预测时段相邻的历史时间序列片段,由于一个节点先前时刻的流量数据必然会对其下一时刻的流量造成较大的影响。这种网络仅利用最近的几个时间间隔,为了能更好地进行长期预测,还需考虑周期性信息。由于我们的工作时间较统一,容易出现交通早晚高峰现象,交通流量数据在相同时刻有较强的相似性。交通流量数据也拥有明显的周周期模式,比如,周一的交通模式通常与之前的周一的交通模式相似,而与周末的交通模式略有不同。

  训练 LSTM 处理长期信息是一项艰巨任务,因为随着时间序列长度的增加,会显著减弱周期性的影响。为解决此问题,应该对预测目标的相对时段(例如,昨天的这个时候,前天的这个时候等)进行建模。然而,仅考虑相对时段是不足的,因为这忽略了周期的时间变化,即交通数据非严格周期性的。例如,工作日的高峰期常出现在下午的后半段,可能在下午 4:30 到下午 7:00 之间。如果遇到交通事故或出现交通拥堵现象,周期的变化在交通序列中是广泛存在的。即周期性非严格按日或按周的。因此,我们设计了一个周期性注意力机制来解决这些限制。具体的描述如下。

  图 2 中的 b 部分,包含了前 P 天对应的时段用于处理周期性依赖。对于每天,为解决周期性时间变化问题,从每天中额外的选择 Q 个时段。例如,假若预测的时间是上午 9:00—9:30,我们选择前一个小时和后一个小时,即上午 8:00 —10:30, | | 5 Q 。这些时段 q Q 用来处理潜在的时间周期性变化。另外,使用 LSTM 来处理每天 p P 的序列信息,其公式如式(9)所示: , , , , 1 , , , , LS T M ([ ; ], ) p q p q p q p q i t i t i t i t h x e h  (9) 其中, , , p q i t h 是路段 i 预测时间为 t 在前 p 天中的时段 q 的输出表示。 , , p q i t e 表示外部变量(如天气)。因此, , , p q i t h 既包含空间信息又包含时间信息。

  并不是先前的每一天对目标预测贡献相同,我们利用一种注意力机制捕获时间的变化,且获取到前几天的每一天的加权表示。如图 2 的 c 部分所示,形式上,前几天的每一天的表示 , p it h 是每个所选时段 q 的加权和,其定义如式(10)所示: , , , , , p p q p q i t i t i t q Q h h   (10) 其中,权重 , , p q  i t 衡量了在 p P 这天时段 q 的重要性。 , , p q  i t 通过对比从 LSTM 得到的时空表示(见公式 8)和前一个隐状态 , , p q i t h 得到的,其计算就使用了注意力机制,其计算如式(11)所示: , , , , , , , , exp(score( , )) exp(score( , )) p q p q i t i t i t p q i t i t q Q h h h h  (11)参考文献[15],注意力分数的定义可以视为基于内容的函数: , T , , , , , score( , ) tanh( ) p q p q i t i t H i t X i t X h h v W h W h b    (12) 其中, , , , W W b v H X X 是参数, T v 是 v 的转置。对于之前的每一天 p ,我们得到一个周期表示 , p it h 。然后,我们使用另一个 LSTM 用这些周期表示作为输入,保存序列信息,如公式(13)所示。 1 , , , LST M ( , ) p p p i t i t i t h h h  (13) 我们将最后一个时段的输出 , P h it 作为时间动态相似性的表示(即长期周期信息)。

  6 模型训练

  我们将短期依赖 it, h 和长期依赖 , P h it 拼接得到 , c it h ,如公式(14)所示,其中符号:表示拼接。对于预测路段和时间来说既保留了短期依赖又保留了长期依赖。对应于图 2 的 c 部分,即将第 t 天的短期依赖和 t 天之前的长期依赖通过图 2(c)中的加号连接起来,然后我们将 , c it h 输入到全连接层,获得每个路段 i 的交通流量的最终预测值,表示为 i t, 1 y  ,如图 2 的 d 部分所示,最终的预测函数定义如下: , 1 , tanh( ) c i t fa i t fa y W h b   (15) 其中, W fa 和 fa b 是参数。由于我们做了归一化操作,因此模型的输出范围是 ( 1,1)  。我们稍后对预测值进行归一化的反向操作,使其回到实际范围。

  在训练阶段,目标是让道路上的实际交通流量和预测值间的误差最小。模型的损失函数如公式(16)所示。 , 1 , 1 1 n i t reg i t i y y L      (16) 其中, i t, 1 y 和 i t, 1 y 分别表示预测流量值和实际流量值。是超参数。公式(15)的第一项用于最小化实际交通流量与预测流量之间的误差。第二项 reg L 是 L2 正则化项,能够有效地防止过拟合[16]。

  7 PeMS 数据集

  公共数据集 PeMS 是从多于 39,000 个单独的探测器中收集的。这些传感器横跨加利福尼亚州主要大都市,提供了十多年的数据,其中包含影响车流量的各类信息。本文我们使用的是 2017—2018 年的圣地亚哥地区的探测器。交通流的搜集时间段从2017年的6月至2018年的4月(共13个月)。选取前 12 个月的数据作为训练集,并用最后一个月(2018 年 4 月)的数据作为测试集。

  我们将数据集的标准时间间隔设置为 5min。因而,道路图中的每个节点每天有 288 个数据点。对数据清理后的缺失值使用线性插值法进行填充。另外,利用 Z-Score 方法对输入进行归一化。

  在 PeMS 中,道路图的邻接矩阵是根据交通网络中站点之间的距离来计算的。加权邻接矩阵 W 可以表示为:        (17) 其中, ij 表示从站点 i 到站点 j 的边的权重, ij d 表示从站点 i 到站点 j 的道路距离,是距离的标准差,是控制矩阵分布和稀疏性的阈值。在本节中,将 2 和分别指定为 1.5 和 0.5。

  8 实验部分

  8.1 评价指标

  为了评估 STPAN 模型的预测性能,使用三个标准指标来计算现实的交通状态与预测状态之间的误差。它们的定义如下: 1. 平均绝对误差(MAE) 1 1 N i i i M A E y y N    (18) 2. 均方根误差(RMSE) 2 1 1 ( ) N i i i RM SE y y N    (19) 3. 平均绝对百分比误差(MAPE) 1 1 100 N i i i i y y M A P E N y    (20) 其中, N 是测试数据集的大小, i y 和 i y 分别是实际值和预测值。对于这三个指标,值越小性能越好。

  8.2 对比方法

  在本小节,我们评估 STPAN 和其它方法在 PeMS 数据集的预测性能。对比方法有传统的时间序列分析方法(HA、 ARIMA)、机器学习方法(SVR、XGBoost)和深度学习模型 (STGCN、DCRNN)。

  (1) HA:历史平均值。历史平均模型根据训练集的经验统计来预测测试数据集的未来交通流量。例如,路段 i l L 的 9:00-9:05 期间的平均交通流量是依据同一路段的 9:00-9:05 期间训练数据集中的历史交通流量的平均值来估计。

  (2) ARIMA:自回归移动平均模型。对于 ARIMA(p,d,q) 模型[17],对数据进行差分的阶数设置为 d  1 ,通过使用 p  [0, 2] , q  [7,12] 计算训练数据集的相关赤池信息准则 (AIC)来确定自回归部分和移动平均部分(p,q)。

  (3) SVR:支持向量回归。我们选取径向基核函数进行训练,其中核系数设置为 0.1。

  (4) XGBoost:极端梯度提升。XGBoost[18]是一套提升树可扩展的机器学习系统。它是基于树结构的端到端的提升系统。

  (5) STGCN:时空图卷积网络[12]。ST-Conv 块的三层通道分别是 64、16 和 64。图卷积和时间卷积的核大小设置为 3。STGCN模型使用RMSprop优化器对MSE进行最小化训练,batch 大小为 50。初始学习率为 0.001,每 5 个 epochs 之后衰减率为 0.7。

  (6) DCRNN: 扩散卷积递归神经网络[11]。DCRNN 是通过 Adam 优化器最小化 MAE 进行训练的。编码器和解码器均有两个 LSTM 层,每个 LSTM 层有 64 个单元。最初的学习率是 0.01,从第 20 个 epoch 开始,每 10 个 epochs 缩短10%。随机游走的最大步数设置为 3,最大 epoch 为 100,根据监测验证误差决定是否采取提前终止的措施。

  8.3 实验设置

  我们的实验设备是 Intel®Core™i7-4790 3.60GHZ CPU 和四个 NVIDIA GeForce Titan X Pascal GPU。

  对于 PeMS 数据集,我们采用的是 13 个月(2017 年 4 月到 2018 年 4 月)的交通流量,在实验时,我们选择前 12 个月的交通流量数据作为训练集,并用最后一个月(2018 年 4 月)的数据作为测试集,随机抽取 20%的训练样本作为验证集。

  我们根据验证集的性能来设置 STPAN 模型的超参数。对于空间信息,我们将卷积核大小设置为 3 3  ,64 个过滤器。我们把 K 设为 3。对于时间信息,将短期 LSTM 长度设为 7(即前 3.5 个小时),长期周期信息 |P |=3 (即前 3 天),周期性注意力机制 Q  3 (即考虑相对于预测时间的前后半小时),LSTM 的隐藏层的维数设为 128。模型 STPAN 使用 Adam 进行优化,batch size 为 64,学习率为 0.001。LSTM 中的 dropout 为 0.5。

  8.4 在 PeMS 数据集上的性能评价

  图 3 展示的是在 PeMS 数据集上预测 2018 年 4 月 10 日的交通流量图。从图中可看到本文提出的模型 STPAN 可以较好地捕获到早高峰和晚高峰时段的趋势走向,与真实交通流量非常接近。

  图 4 描述的是在 PeMS 数据集上预测 2018 年 4 月 1 日的交通流量。因为 2018 年复活节的时间是 2018 年 04 月 01日,与愚人节是同一天,高于往常交通流量,因此图 4 的整体交通流量高于图 3 的交通流量,本文提出的 STPAN 模型能捕捉到流量的变化趋势,图 4 的趋势走向和图 3 的趋势走向较吻合,交通流量的高峰时段大致相似。

  图 5 描述的是在 PeMS 数据集上对 2018 年 04 月 03 日至 2018 年 04 月 10 日共一周的交通流量预测结果。预测的时间间隔为 5 分钟。从图中能看到交通流量数据随时间动态变化,每天的早高峰和晚高峰时段相似,呈现出强烈的周期性特征,尽管每天的流量趋势相似但又不完全相同。本文提出的 STPAN 模型在 PeMS 数据集上较好地实现了对交通流量的预测。

  表 2 描述的是 STPAN 模型与其它方法在 PeMS 数据集上进行 15 分钟、30 分钟和 45 分钟的流量预测的实验对比结果,从表中我们看到本文提出的 STPAN 模型在三个评价指标中均获得了最好的性能。传统的统计和机器学习方法对于短期预测表现良好,但因为误差积累和缺乏空间信息,它们的长期预测并不准确。深度学习模型通常比传统的机器学习模型更能取得好的预测效果。由于模型 STPAN 不仅对传感器的空间拓扑进行建模,而且在时间维度上利用周期性注意力机制以及外部环境信息,从而使得我们的模型 STPAN 在短期和中长期预测方面均优于 STGCN 和 DCRNN。

  8.5 消融实验

  为证明 STPAN 模型中的每个组件对预测效果的影响,我们用控制变量法对 STPAN 的变体做进一步的研究。虽然更改了部件,但所有变体均拥有相同的框架结构和参数设置。具体地说,在提出的 STPAN 框架中,一次删除一个组件。首先,将 STPAN 的变体命名如下。

  (1) STPAN/noGCN:不带GCN组件的STPAN模型。这种没有 GCN 的 STPAN 变体对空间相关性不敏感。

  (2) STPAN/noPA:没有周期性注意力机制的 STPAN 模型。STPAN/noPA有两个LSTM网络。一个是作为捕获短期依赖关系,另一个是根据前 3 天信息中的相对时间来获取长期信息。注意,我们设置 Q =1 (仅考虑前 3 天的相对预测时间)。

  图 6 描述的是 STPAN 及其两个变体在不同预测时间间隔下的 MAPE 的对比结果。从图中看出,STPAN 取得了最低的 MAPE 值,STPAN/noGCN 是三种方法中最高的 MAPE 值,由于此变体模型没有对空间信息进行提取,预测效果远低于 STPAN 模型,这表明空间依赖性对最终模型的预测效果影响很大,也侧面说明了 GCN(对空间相关性进行建模) 在交通流预测中的重要性。此外,通过对比 STPAN/noPA 和 STPAN 的性能,表明周期性注意力机制的加入对模型的预测性能有了一定的提升。

  9 结语

  预测未来交通流量是智能交通系统中的关键问题之一。交通流量数据受各种因素共同影响,其是一个非线性、随时间改变的复杂的随机过程。由于道路按功能区域的空间分布、人们出行需求的差异,使得交通流具有时空特性,且交通流量的预测受大量复杂因素的影响。

  准确的交通流量预测不但为交通管理员和出行人提供有价值的信息,且有利于提升道路资源利用率,减少人们的出行和时间成本,实现交通管理从“被动”变为“主动”的关键。

  本文提出了一种时空周期性注意力网络的交通流量预测模型(STPAN)。首先,使用 GCN 来描述基于图的交通流数据的空间相关性。其次,综合考虑短期和长期的周期性信息进行流量预测,并使用 LSTM 获得时序依赖关系。因为时间上的周期性非严格固定的,因此本文利用周期性注意力机制来处理此问题。本文还将天气等外部信息增添到模型中,以提高模型的预测性能。

  本文将 STPAN 模型与 HA、ARIMA、SVR、XGBoost、 STGCN、DCRNN 在 PeMS 数据集上分别进行实验,实验结果表明,在不同的预测间隔下,STPAN 模型的预测性能均优 于 其 他 方 法 。 此 外 , 还 将 STPAN 和 两 种 其 变 体 (STPAN/noGCN、STPAN/noPA)进行了对比实验,结果表明, STPAN 模型的预测效果是最好的。