本技术属于交通技术领域,特别涉及一种实现交通点语义和网络拓扑共挖掘的交通流预测模型。模型的名称为STIGNN,STIGNN在空间特征聚合方面,将重点放到交通点特征与交通点间拓扑关系的耦合,综合考虑潜在的和现有的空间依赖性。STIGNN能够通过基于门控的时间卷积层来处理长时间序列,通过在时空框架中引入节点特征与拓扑关系的双重注意力注意机制,该模型可以直接应用于归纳学习任务,并可以推广到任何具备复杂实体及关系的网络。在两个公共真实交通网络数据集METR‑LA和PEMS‑BAY上的实验结果表明,STIGNN优于先进的基线模型。
背景技术
交通流预测是交通领域中城市交通控制与调度的关键任务,具有高度的非线性和复杂性。交通系统是现代城市的重要基础建设,支撑着数百万人的日常交际和旅行。随着城市化以及人口的快速发展,交通系统变的越来越复杂,频繁的交通堵塞,交通事故等安全问题随之出现。智能交通系统应运而生并快速发展,旨在通过充分利用人工智能,物联网及移动通讯等前沿技术,实现人、车、路等要素的高效协同。交通流预测是智能交通系统中的核心组成部分,其任务是利用给定的历史速度数据和基础道路网络预测未来交通流速度,有效避免交通拥堵,提高交通系统的运行效率。但交通流预测是一个复杂的时空预测问题。特定区域的交通状态不仅受其周围交通路线分布影响,同时也会根据不同时间段动态变化。空间以及时间的依赖使得交通流预测面临着巨大的挑战。
研究人员为了解决交通流预测问题提出了许多算法模型。传统的统计学模型如临时平均(historical average,HA)模型,求和自回归移动平均(auto-regressiveintegrated moving average,ARIMA)模型,卡尔曼滤波模型等,受限于对平稳性假设的依赖,不能捕获交通数据间复杂的动态关系,预测能力十分有限。传统的机器学习算法如支持回归向量机(support vector regression,SVR),线性回归(Linear regression,LR)等通过对历史交通数据的挖掘,在传统统计学模型的基础上进行了进一步的提升,但其仍无法突破模型在时空上的复杂性。在计算机视觉和自然语言处理领域深度学习技术取得巨大成功的鼓舞下,研究人员将能挖掘时间依赖的循环神经网络(recurrent neural network,RNN)模型及能捕获空间依赖的卷积神经网络(Convolutional neural networks,CNN)引入到交通预测当中,交通流预测任务取得了前所未有的成功。期间涌现出了如LSTMNN,GBM等优秀的交通流预测模型。但CNN与RNN只能用于欧几里得数据(即图象、文本和视频),道路网络的空间依赖是通过非欧几里得图结构表示的。将图结构序列化表示必然会带来信息的损失,不利于空间拓扑信息的挖掘。
近年来,图神经网络(GNN)已经成为深度学习研究的前沿,在各种应用中显示出最先进的性能。它能够捕捉对象之间的复杂关系,并基于图形描述的数据进行推理。GNN已被证明在各种节点级、边缘级和图形级预测任务中是有效的。事实上,GNN非常适用于交通预测问题,道路网络本质是一个图,道路的传感器是节点,传感器间的连接是边。以图为输入,受益于交通网络拓扑信息的补全,基于GNN的模型在道路交通流量预测任务上会表现出比以前的方法更优越的性能。STGCN模型首次将GNN网络应用至交通网络预测,通过使用图卷积神经网络(Graph Convolutional Network,GCN)挖掘交通网络拓扑信息,使用基于门控机制的时间卷积(Gated temporal convolutional layer, Gated TCN)模块代替RNN模型捕捉时段特性,该模型在METR-LA与PEMS-BAY数据集中取得了优异的预测结果。之后研究者将视线聚焦于图神经网络算法向交通预测的迁移,涌现出了大量的基于GNN与RNN结合的交通预测模型。如使用扩散卷积神经网络(Diffusion convolutional neural networks,DCNNs)与门控循环单元(Gated recurrent unit,GRU)的DCRNN模型,使用图注意力网络(Graph attation neural network,GAT)与Gated TCN模块的STGAT模型,使用GCN与长短时记忆网络(Long short-term memory,LSTM)的GC-LSTM模型等。可以明显的观察到目前基于时空图结构的交通流预测模型将重点放在了对图神经网络与循环神经网络模块的优化,不同的组合方式总能给交通流预测带来惊喜。当然期间也引入了许多策略,比如在GraphWaveNet模型中引入的可学习邻接矩阵。研究者们根据地图挖掘出来的道路结构信息受制于人工处理粒度,仍然会忽略部分关键网络信息。通过让网络自适应学习图结构信息并与已知的图结构进行联合预测,可以有效图结构缺失的问题。Graph WaveNet同样是基于GCN与Gated TCN模块,却比DCRNN取得了更高的预测精度。可学习矩阵策略同时也在STGAT模型中出现,实验再次证明该策略的可行性。
通过考虑底层的图形结构,GNN已经取得了重大进展。然而,仍然存在一些挑战;例如,作为节点的左右车道虽然距离很近,但其相关度不一定比更远距离的同一方向车道更具强。再比如,基建相似的交通路段即使距离较远,也会具有参考价值。希望实现道路自身信息与道路网络拓扑信息的进一步耦合,但图神经网络对于拓扑信息和节点语义信息的联合挖掘仍存在一定空缺。无论是GCN模型,GAT模型,DCNN模型等,都是节点级的信息聚合方式,目标节点对二阶邻居信息的挖掘只能通过一阶邻居获得,无法充分挖掘网络拓扑信息。模型中SGC模型,ChebNet模型虽然可以同时挖掘多阶拓扑信息,但其对节点间的语义关联的挖掘并不到位,只是根据图结构制定图信息聚合策略。并且只有少量模型的信息聚合规则是可学习的,模型无法自行筛选哪些信息是重要的,哪些是非重要的。在聚合规则可学习的模型中,GAT通过计算节点间的动态注意力调整节点间的信息聚合方式,可是其只限于一阶图结构,信息的依赖性挖掘更多基于节点自身语义信息,网络中不同阶邻居间的关系并不能很好的挖掘。ChebNet对不同阶的邻居的节点集施加静态注意力,通过学习判断每个节点的哪一阶邻居集更重要,但学习参数设置于网络拓扑,节点语义关联并不能得到充分提取。两个模型的融合或许可以帮助找到同时挖掘交通网络拓扑信息与交通节点语义信息的交通流预测方案。
为了更好的挖掘交通网络的时空关系,提高交通流预测精度。本发明提出了一种结合交通节点语义信息和网络拓扑信息的时空图神经网络。
实现思路