计算机系统应用  2021, Vol. 30 Issue (5): 214-218   PDF    
基于多图时空图卷积神经网络的网约车需求预测
周云彤1, 熊卫华1, 姜明2     
1. 浙江理工大学 机械与自动控制学院, 杭州 310018;
2. 杭州电子科技大学 计算机学院, 杭州 310018
摘要:随着时代发展, 网约车已经逐渐成为当今社会的重要出行方式. 这项新的出行方式大大降低了出行成本, 使人们的生活更加便捷. 网约车需求预测是人工智能交通系统的重要组成部分, 有着良好的应用价值, 但传统的研究在建模时, 忽略了目的地和不同地区的社会属性相似性的影响, 使得模型的特征不全面, 算法预测准确率较低. 针对上述问题, 本文提出了一种多图时空图卷积网络 (Multi-Graph Spatial-Temporal Graph Convolution Neural network, MGSTGCN), 以解决网约车需求预测问题. 该网络由空间与时间两个组件构成, 空间问题的网络采用图卷积来对地理信息、移动信息与社会属性相似性进行建模, 时间问题则使用注意力机制与LSTM网络结合进行处理. 实验中, 我们与四种主流网络模型进行对比分析, 结果表明该模型可以更有效地捕获网约车需求数据的时间与空间的特征, 提高预测的准确度.
关键词: 交通大数据    网约车需求预测    图嵌入    图卷积神经网络    注意力机制    
Prediction of Ride-Hailing Demand Based on Multi-Graph Spatial-Temporal Graph CNN
ZHOU Yun-Tong1, XIONG Wei-Hua1, JIANG Ming2     
1. Faculty of Mechanical Engineering and Automation, Zhejiang Sci-Tech University, Hangzhou 310018, China;
2. School of Computer Science and Technology, Hangzhou Dianzi University, Hangzhou 310018, China
Foundation item: National Natural Science Foundation of China (61803339); Natural Science Foundation of Zhejiang Province (LQ18F030011); Key Research and Development Program of Zhejiang Province (2019C03096)
Abstract: With the development of the times, online car-hailing has gradually become an important mode of travel in today’s society. This new travel mode greatly reduces the travel costs and makes people’s lives more convenient. Online car-hailing demand forecast is an important part of the artificial intelligence transport system and has high application value. However, traditional research ignores the impact of the social attribute similarity between the destination and different regions when modeling, making the characteristics of the models incomprehensive and the forecast accuracy of the algorithms low. In response to the above problems, a Multi-Graph Spatial-Temporal Graph Convolution Neural network (MGSTGCN) is proposed to solve the forecast problem of online car-hailing demand. The network consists of spatial and temporal components. The network associated with spatial problems models the similarity of geographic information, mobile information, and social attributes through graph convolution, and the temporal problems are processed by combining the attention mechanism with the LSTM network. In the experiments, we comparatively analyze the proposed model with four mainstream network models, and the results show that this model can more effectively capture the spatial-temporal characteristics of online ride-hailing demand data and increase the forecast accuracy.
Key words: traffic big data     online car-hailing demand forecast     graph embedding     Graph Convolutional Neural network (GCN)     attention mechanism    

1 引言

网约车是当今社会的主要出行方式之一, 为人们的生活带来了便捷, 然而这一行业也存在许多问题, 如乘客等待时间长, 司机空车率高[1]. 造成这些问题的主要原因是网约车调度不合理, 过多的车辆集中在繁忙区域导致车辆的供给大于需求, 而在较为偏远的地区, 网约车数量极少, 分布极为稀疏[2]. 网约车需求预测可以有效应对这一问题, 通过预测区域内网约车的需求, 提前引导司机前往不同的区域, 从而避免出现网约车分布不均匀的问题[3].

网约车需求预测是智能交通系统的重要组成部分, 也是交通大数据分析的一项难题, 这是因为其受到多种时空因素的共同影响, 单一因素的建模方式很难实现准确的预测. 目前研究人员提出了许多方法来解决这一问题, 大致可以分为机器学习和深度学习两类, 前者需要的训练数据较少但准确率较低, 后者则恰好相反. 其中机器学习的方法主要有线性回归[4]和支持向量回归[5]; 深度学习的方法有卷积神经网络(CNN)[6]、卷积神经网络与长短时神经网络(LSTM)相结合[7]和图卷积神经网络(GCN)[8]. 但这些方法考虑的影响因素不足, 仍然无法避免模型不完善的问题. 在时间因素方面, 出租车需求预测会受季节、节假日和工作时间的影响; 同时历史的出行信息也会有一定的影响, 这是因为乘客在到达目的地后, 大概率会在一段时间后从目的地再次出发前往下一个区域. 在空间因素方面, 出租车需求预测在空间上受到地理位置的限制; 同时不同的地理位置可能具有相似的社会意义也会影响出租车的需求.

针对上述问题, 本文提出了一种多图时空图卷积网络(MGSTGCN), 以提高网约车需求预测的准确性. 该网络在空间上使用图卷积神经网络进行特征捕获, 针对不同地区的地理位置属性、交通起止点(OD)属性和社会意义相似性建立了3种图, 随后进行聚合; 在时间上使用长短期记忆网络(LSTM). 最后使用了成都网约车轨迹数据和曼哈顿区出租车数据对所建立网络进行验证.

2 算法框架 2.1 出租车需求预测建模

本文采用了交通领域的经典处理方法[9], 将待处理区域平均分为多个网格, 若将网格分为9个, 每个网格由最大坐标与最小坐标定义, 如图1所示, 通过这样的方式, 研究每个小格子区域内的出租车需求. 随后将每个格子看作图的一个顶点, 用于构建出租车需求预测的图模型.

图 1 网格划分方法

在空间建模方面, 文献[10]考虑了地理位置因素和OD的影响, 本文则在此基础上研究了不同区域的社会属性对预测问题的影响, 包括商业街、大学城、工业园等, 通过研究发现, 即使相隔距离很远, 具有相似社会属性的地区在交通流上具有高度相似性. 最终本文采用地理位置因素、OD因素以及社会属性因素分别构筑了地理图、OD图和社会属性图.

在时间建模方面, 则考虑历史出行特征, 通过LSTM和注意力机制进行时间特性的捕获, 来掌握时间维度上的出租车需求变化, 可以预测每对网格间的需求.

2.2 空间网络模型 2.2.1 空间建模

图1划分为例, 将每个网格看作一个图的节点, 本文在此基础上建立了3种图来捕获空间特征, 如图2所示. 其中, 图2(a)为地理图结构, 将每个网格的中心点视作网格的地理位置中心, 中心点的距离视作地理图结构的边权值. 设中心距离的单位为u, 那么网格8和9之间距离记作 $dist({m_{{\rm{ }}8}},{m_{{\rm{ }}9}}) = u$ , 网格8和4之间距离记作 $dist({m_{{\rm{ }}8}},{m_{{\rm{ }}4}}) = \sqrt 2 u$ , 距离越近权值则越小, 两者间的出租车需求也会有一定的相似性, 可将地理图范围集 ${\varphi _i}$ 定义为式(1):

$ {\varphi _i} = \left\{ {{m_j}|dist({m_i},{m_j}) \le L} \right\} $ (1)

其中, L为可设定阈值.

图2(b)为OD图结构, 本文使用了OD矩阵来对OD图进行定义: 只要任意两个顶点间有出租车需求存在, 那么它们就是相关的. 同时, OD图会受时间因素的影响, 这是因为在不同的时间段内, 两个区域间的OD信息常常是不同的, 所以建模时要考虑到不同时间下OD图的变化情况.

本文假定两个地区社会属性相似, 相距距离较大, 则此时在地理图和OD图上, 这两个地区的关联度较小, 但由于社会属性的相似性, 两个地区的出租车需求相似性较高. 为了应对这种情况, 本文设计了社会属性图, 其结构如图2(c)所示. 本文将每个网格的社会属性分为: 工业、生活、出行、商业、娱乐和住宿, 每个栅格的社会属性由其所包括的非地理意义点(POI)的属性所决定.

图 2 空间图结构

本文爬取了成都部分地区的POI点, 将每个栅格内的POI点进行了社会意义分类, 栅格的社会属性与相同属性最多的POI点保持一致, 随后在建立图结构时, 应用动态时间规划法(DTW), 来量化社会属性相似的网格间的相似度, 公式如式(2)所示:

$ {S_{i,j}} = \left\{ \begin{split} & \exp ( - DTW({F_i},{F_j})),\;\;i \ne j \\ & 1,\;\;i = j \\ \end{split} \right. $ (2)

其中, ${F_i} \in {\mathbb{R}^{1 \times T}}$ 表示离开第i个网格的出租车流出向量, T为向量长度, 由所选定的对照时间尺度所决定. 得到矩阵S后对其进行归一化即可得到社会属性图的权重.

2.2.2 图模型聚合器

如果将每种图模型单独进行训练会大大提升算法的复杂度, 为避免这一缺点, 本文在传统聚合函数的基础上进行改进[11], 综合考虑了3种图模型对预测结果的不同影响程度, 设计了一种图聚合器. 地理图的聚合器方式如式(3)所示:

$ l_{t'}^i = \sigma \left( {{W_l} \cdot \left( {f_{t'}^i + \sum\limits_{{m_j} \in {\varphi _{_i}}} {\frac{{dis{t^2}({m_i},{m_j})}}{{\displaystyle\sum {dis{t^2}({m_i},{m_j})} }}} } \right)f_{t'}^j} \right) $ (3)

其中, $l_{t'}^i$ 表示时间 $t'$ 时的地理图嵌入矢量; ${W_l}$ 是可训练的权重矩阵; 而 $f_{t'}^i$ $f_{t'}^j$ 分别是地理聚合操作之前的 ${m_i}$ ${m_j}$ 的特征. 同理可进行出OD图和社会图的特征聚合, OD图的特征聚合如式(4)所示:

$ p_{t'}^i = \sigma \left( {{W_p} \cdot \left( {f_{t'}^i + \sum {\frac{{nu{m^2}({m_j})}}{{\displaystyle\sum {nu{m^2}(m{}_j)} }}} } \right)f_{t'}^j} \right) $ (4)

式中, $num({m_j})$ 表示于 ${m_j}$ 开始或结束的需求量, ${W_q}$ 是可训练的权重矩阵. 而 $p_{t'}^i$ 表示时间 $t'$ 下的OD图嵌入矢量, $f_{t'}^i$ $f_{t'}^j$ 分别是OD聚合操作之前的 ${m_i}$ ${m_j}$ 的特征.

社会图的特征聚合如式(5)所示:

$ q_{t'}^i = \sigma \left( {{W_q} \cdot \left( {f_{t'}^i + \sum {\frac{{{S^2}({m_i},{m_j})}}{{\displaystyle\sum {{S^2}({m_i},{m_j})} }}} } \right)f_{t'}^j} \right) $ (5)

式中, $S({m_i},{m_j})$ 表示 ${m_i}$ ${m_j}$ 的社会属性相似度, $q_{t'}^i$ 表示时间 $t'$ 下的社会图嵌入矢量, ${W_q}$ 是可训练的权重矩阵 $f_{t'}^i$ $f_{t'}^j$ 分别是社会属性聚合操作之前的 ${m_i}$ ${m_j}$ 的特征.

将3种聚合器加以整合即可得到图的最终聚合表示:

$ G_{t'}^i = \left[ {o_{t'}^i,p_{t'}^i,q_{t'}^i} \right] $ (6)
2.3 时空网络架构

MGSTGCN的时间架构部分与LSTM一样都有LSTM的输入门、忘记门和输出门, 但均由图卷积算子而得, 且引入了注意力机制, 其中时间序列为输入. 时间结构与空间结构相结合构成了MGSTGCN网络, MGSTGCN的层结构如图3所示.

图 3 MGSTGCN网络结构

注意力机制的引入目的是增强关键节点的信息, 如式(7)所示:

$\left\{ \begin{split} & {f_t} = \sigma ({W_f}[{h_{t - 1}},{x_t}] + {b_f}) \\ & {i_t} = \sigma ({W_i}[{h_{t - 1}},{x_t}] + {b_i}) \\ & {o_t} = \sigma ({W_o}[{h_{t - 1}},{x_t}] + {b_o}) \\ & {c_t} = {f_t} \odot {c_{t - 1}} + {i_t} \odot \tanh ({W_c}[{h_{t - 1}},{x_t}] + {b_f}) \\ &{{\hat h }_t} = {o_t} \odot \tanh ({c_t})\\ &{h_t} = {f_{\rm att}}\left( {{{\hat h }_t}} \right) + {{\hat h }_t}\\ \end{split}\right. $ (7)

其中, $\sigma ( \cdot )$ 为sigmoid函数, $ \odot $ 为同或运算符, $i,\;f,\;o,\;c$ 分别代表输入门, 遗忘门, 输出门和细胞状态向量. 当它们中的每一个都被更新时, 有相应的可训练权重W和偏差向量b, ${f_{\rm att}}$ 代表注意力网络, 可以在增强关键节点信息的同时保证信息的完整性, ${f_{\rm att}}\left( {{{\hat h} _t}} \right)$ 所得为注意力矩阵. 注意力矩阵设为 $V = ({V_1},{V_2},\cdots,{V_t},\cdots,{V_N})$ , ${V_t}$ 为列向量, 计算公式如式(8)所示.

$ {V_t} = softmax\left( {K\tanh \left( {W{ \hat h _t} + b} \right)} \right) $ (8)

式(8)中, 通过 $softmax( \cdot )$ 函数进行归一化, 得到注意力矩阵V. ${V_t}$ 在语义上理解为输出时刻t时, 节点间的相互依赖程度向量.

3 实验 3.1 数据集处理

本文选用数据集为成都市局部区域的滴滴快专车平台的轨迹数据和纽约市曼哈顿区出租车数据集.

其中成都市数据集的时长为2016年11月1日至11月30日, 该数据集来自于滴滴公司的盖亚数据开放计划, 轨迹点的采集间隔是2–4 s. 轨迹点经过了绑路的处理, 保证了数据都能够对应到实际的道路信息. 司机及订单信息进行了加密脱敏匿名化处理. 纽约市曼哈顿区出租车数据集的时长为2018年7月1日至7月30日. 本文分别选取前20天数据作为训练集, 后10天数据作为测试集.

3.2 评估指标

本文选取的评估指标为均方根误差(RMSE)和对称平均绝对百分比误差(SMAPE), 用以评估预测准确性. RMSESMAPE的计算公式如式(9)和式(10)所示:

$ RMSE = \sqrt {\frac{1}{{\left| {\left. {{M_{t + 1}}} \right|} \right. \times N}}\sum\limits_{n = 1}^N {\left. {\left\| {M_{t + 1}^n - } \right.\hat M_{t + 1}^n} \right\|} } $ (9)
$ SMAPE = \frac{2}{{\left| {\left. {{M_{t + 1}}} \right|} \right. \times N}}\sum\limits_{n = 1}^N {\sum\limits_{m \in M_{t + 1}^n} {\frac{{m - \hat m}}{{m + \hat m + 1}}} } $ (10)
3.3 实验结果

为证明模型的有效性和准确性, 本文选取了4种主流模型与本文算法进行对照试验, 分别是: HA[10]、LSTNet[11]、GCRN[12]、GEML[8]、MGSTGCN. 实验结果如表1所示.

表 1 与4种主流模型的实验对照结果

同时为检验该模型的稳定性, 本文选取了32, 64, 128, 256, 512的网格维度与模型进行了对照实验, 以GEML模型为例, 实验结果如图4所示. 可以看出在不同的网格维度下, 该模型的算法性能均优于GEML模型, 且维度越高, 划分越精密, 该模型的优越性越明显.

图 4 网格维度对照实验

4 结论

本文提出了多图时空图卷积神经网络来解决网约车需求预测问题, 该网络将区域网格看作图的顶点, 结合了地理属性、出入流属性和社会属性构建空间图模型, 结合历史出行规律构建时间模型, 并引入了注意力机制, 从而可以有效地预测区域内的出租车需求. 成都市局部区域的滴滴快专车平台的轨迹数据和纽约市曼哈顿区出租车数据集用于训练和测试, 实验结果表明, 该模型的RMSESMAPE指标均优于其余主流模型, 其中相较于GEML模型, 在成都市和曼哈顿区的数据集上, MGSTGCN的RMSE指标分别降低了16.03%和15.46%, SMAPE指标分别降低了11.57%和4.77%, 且随着网格维数的增加, 本文算法的优越性越明显, 可以更有效地进行网约车需求预测.

进一步还需要探索的问题是找到更好的网格划分标准, 同时再结合网约车的营收数据, 扩展模型功能, 有效提高网约车的运营效率和营收情况.

参考文献
[1]
Anwar A, Volkov M, Rus D. ChangiNOW: A mobile application for efficient taxi allocation at airports. Proceedings of the 16th International IEEE Conference on Intelligent Transportation Systems (ITSC 2013). Hague, the Netherlands. 2013. 694–701.
[2]
Tong YX, Chen YQ, Zhou ZM, et al. The simpler the better: A unified approach to predicting original taxi demands based on large-scale online platforms. Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Halifax, NS, Canada. 2017. 1653–1662.
[3]
曹成涛, 徐建闽. 基于PSO-SVM的短期交通流预测方法. 计算机工程与应用, 2007, 43(15): 12-14. DOI:10.3321/j.issn:1002-8331.2007.15.004
[4]
Zhang JB, Zheng Y, Qi DK. Deep spatio-temporal residual networks for citywide crowd flows prediction. Proceedings of the 31th AAAI conference on Artificial Intelligence. San Francisco, CA, USA. 2017. 1665–1661.
[5]
段宗涛, 张凯, 杨云, 等. 基于深度CNN-LSTM-ResNet组合模型的出租车需求预测. 交通运输系统工程与信息, 2018, 18(4): 215-223.
[6]
Chu J, Qian K, Wang X, et al. Passenger demand prediction with cellular footprints. Proceedings of the 15th Annual IEEE International Conference on Sensing, Communication, and Networking. Hong Kong, China. 2018. 1–9.
[7]
冯宁, 郭晟楠, 宋超, 等. 面向交通流量预测的多组件时空图卷积网络. 软件学报, 2019, 30(3): 759-769. DOI:10.13328/j.cnki.jos.005697
[8]
Wang YD, Yin HZ, Chen HX, et al. Origin-destination matrix prediction via graph convolution: A new perspective of passenger demand modeling. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage, AK, USA. 2019.1227–1235.
[9]
Hamilton WL, Ying R, Leskovec J. Inductive representation learning on large graphs. Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, CA, USA. 2017. 1024–1034.
[10]
路民超, 李建波, 逄俊杰, 等. 面向出租车需求预测的多因素时空图卷积网络. 计算机工程与应用, 2020, 56(24): 266-273.
[11]
Lai GK, Chang WC, Yang YM, et al. Modeling long- and short-term temporal patterns with deep neural networks. Proceedings of the 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. Ann Arbor, MI, USA. 2018. 95–104.
[12]
Seo Y, Defferrard M, Vandergheynst P, et al. Structured sequence modeling with graph convolutional recurrent networks. Proceedings of the 25th International Conference on Neural Information Processing. Siem Reap, Cambodia. 2018. 362–373.