文章信息
论文题目为《An origin–destination passenger flow prediction system based on convolutional neural network and passenger source-based attention mechanism》,该文于2023年发表于Expert Systems With Applications期刊上。文章提出一种基于乘客源注意机制的卷积神经网络(PSAM-CNN)模型,该模型是一种针对过饱和路段的OD客流预测模型。
摘要
准确的始发客流预测系统对城市地铁运营管理至关重要。然而,目前仍缺乏针对导致城市地铁过饱和的乘客出行需求的有针对性的预测系统。在本研究中,首先确定了过饱和路段的客源,并确定了造成严重过饱和的关键客流需求部分。然后,利用注意机制和掩码损失函数将乘客源信息纳入预测模型,建立了基于乘客源注意机制的卷积神经网络(PSAM-CNN)模型。最后,利用深圳地铁的实际乘客出行需求数据对所建立的PSAM-CNN模型进行了验证。与目前几种最先进的基准模型相比,PSAM-CNN模型可以更准确地预测导致城市地铁过饱和的OD客流,为改善城市地铁的运营管理提供更有针对性和准确的OD流量信息。
介绍
城市地铁是一种低碳交通方式,具有准时、安全、高速等优势。事实上,城市地铁已经成为许多通勤者越来越喜欢的交通方式。近年来,许多城市的旅客出行需求快速增长,给城市地铁的管理和运营带来了巨大压力。快速增长的乘客出行需求可能会导致载客量经常超过列车的容量,这也被称为城市地铁的过度饱和。
城市地铁过度饱和会导致列车拥挤,增加乘客等待时间,严重降低乘客的出行体验。列车调度优化和客流控制是缓解城市地铁过饱和的两种常用方法。列车调度优化方法通过增加列车发车频率来适应旅客出行需求的增长,而客流控制方法通过限制乘客进入车站来减少乘客出行需求。始发客流信息是列车调度优化和客流控制的基础输入,这就要求建立准确可靠的始发客流预测系统。为此,提出了一些开创性的OD客流预测方法,其中大多数方法是在最先进的机器学习和深度学习技术的基础上开发的。
以往的研究发现,只有一部分乘客通过过饱和的城市地铁路段,这些乘客主要来自少数站点。表明许多乘客的出行需求实际上并没有导致城市地铁的过度饱和,导致城市地铁过度饱和的应该是少数人。因此,与预测所有OD对的客流相比,主要关注导致过饱和的OD客流的准确预测可能更有用,但现在仍然缺乏针对特定乘客群体的预测模型和系统。
为了填补这一空缺,我们首先确定通过过饱和路段的乘客来源(始发站),然后,建立了一个基于卷积神经网络(PSAM-CNN)的乘客源注意机制模型。PSAM-CNN模型结合了基于客源的注意机制,预测导致过饱和的旅客的出行需求。本文的贡献总结如下:
(1)通过对城市地铁过饱和路段客源的识别,分析由客源产生并经过过饱和路段的OD客流(PS-OD客流),提供了一种新的客流分析方法。
(2)为了准确预测PS-OD客流,将卷积神经网络(CNN)、卷积注意力模块(CBAM)和基于客源信息的掩码损失函数(PS-MASK)相结合,建立了基于客源注意机制的卷积神经网络(PSAM-CNN)模型。
(3)PSAM-CNN模型利用CNN高效的特征提取能力提取稀疏OD客流矩阵的重要特征,结合基于客源的注意力机制,更好地关注PS-OD流的预测。
(4)将CBAM注意机制与PS-MASK掩码损失函数相结合,建立了基于客源的注意机制。CBAM模块可以自适应地调整不同信道对预测任务的贡献,自适应地感知和选择特征映射的重要区域。PS-MASK掩码损失函数只考虑PS-OD流的RMSE,缩小了模型的重点,更加注重PS-OD流的预测。
(5)PSAM-CNN模型是一种有针对性的OD客流预测模型,可以为制定有针对性的城市地铁运营管理方案提供更有针对性和准确的出行需求信息。验证结果表明,与基准模型相比,PSAM-CNN模型具有更好的预测性能。
方法
(1)确定过饱和路段的乘客来源
作者使用Dijkstra算法来推断每个乘客出行的路径,并假设乘客选择出行时间最短的路径。对于使用单线完成行程的乘客,路径出行时间由路段出行时间组成。对于使用多条线路的乘客,路径出行时间由路段出行时间和换乘时间组成。使用方程1将实际换乘时间乘以放大系数α来估计感知换乘时间。
(1)
作者使用遍历方法来确定合适的α值并估计感知换乘时间。据此,就能推断出每一次乘客出行的路径,并计算出城市地铁各路段的客流量。定义负载率来量化每个路段的过饱和程度。城市地铁区段的负载率是指该区段的客流量与运输能力之比。按公式(2)计算城市地铁各区段的负载率。
(2)
式中,为站点i至站点j路段的负载率,V为该路段的客流量,为特定1小时时间窗内通过该路段的列车数量,C为列车通行能力。将负载率超过1.0的城市地铁区段定义为过饱和区段。
经过过饱和路段的乘客也在火车上遭受拥堵,这些乘客的始发站被定义为客源。如果OD对从起点i到终点j的乘客路径至少经过一个城市地铁网络的过饱和段,则将OD对定义为PS-OD对PS(i,j)。
(2)PSAM-CNN模型框架
该模型由卷积神经网络(CNN)、卷积注意力机制(CBAM)和基于客源信息的掩码损失函数(PS-MASK)组成。基本思想是利用CNN高效的图像特征提取能力,提取稀疏OD矩阵的重要特征,加入客源注意力机制,更好地专注于PS-OD流的预测。PSAM-CNN模型框架如图1所示。在训练过程中,用前n个工作日的历史OD矩阵训练模型,在预测阶段,用作为模型输入预测第d天时间窗t的PS-OD流量。其中,表示第d-n天时间窗口t内的OD矩阵,它里面的每个元素表示OD对的客流量,表示第d天时间窗口t内的PS-OD矩阵,它里面的每个元素表示PS-OD对的客流量。
图 1 PSAM-CNN模型流程图
(3)卷积神经网络
作者使用三个卷积层、三个池化层和一个全连接层构建了CNN。用于提取稀疏OD矩阵的重要特征。首先,使用历史OD矩阵来生成n通道图像,n也表示CNN模型的时间步长。n通道图像用作初始特征映射。在第一层卷积中,使用一个m × m的卷积核扫描每个特征图的局部信息,生成一个大小相同的新特征图。此外,通道数根据使用的卷积核而变化。接下来,在第一池化层中,使用2×2的最大池化对特征图进行降维。在第二层卷积层,再次使用m × m的卷积核生成新的特征图。因此,在第二池化层中,每个新特征图的维数减少,生成F(H × W × C)的特征图。
(4)基于客源的注意力机制
本文将CBAM注意机制与掩码损失函数相结合,建立了基于客源的注意力机制,使PSAM-CNN模型更加关注PS-OD流。CBAM注意机制放在第二池化层之后。结构如图2所示,由通道注意力模块(CAM)和空间注意模块(SAM)组成。CAM用于考虑不同通道之间的关系并调整它们的相对权重。SAM学习输入特征映射中不同区域的空间关系,并对不同的重要空间区域分配适当的权值。
图 2 CBAM注意机制的结构
在CAM中,输入特征图F(H × W × C),分别使用2×2的最大池化和平均池化,生成两个空间上下文描述符,将其输入到多层感知机(MLP)。MLP输出两个1 × 1 × C的空间上下文描述符,将它们按元素求和并经过sigmoid函数生成1 × 1 × C通道注意力。将通道注意力与特征图F(H × W × C)相乘,生成通道注意力特征图F ' (H × W × C)。
在SAM中,将CAM输出的特征映射F ' (H × W × C)作为输入。对于每个特征映射,分别使用2×2的最大池化和平均池化,然后将两个特征映射连接起来,接着通过1×1的卷积操作将特征映射的维数降为H × W × 1空间注意力。将空间注意力经过sigmoid函数,最后将其与F ' (H × W × C)相乘,生成空间注意特征映射F″(H × W × C)。
在第三卷积层和第三池化层中,对F″(H × W × C)进一步降维,生成特征图F″(H × W × 1)。再对F″(H × W × 1)进行展平操作,将其结果输入进全连接层。输出预测的OD客流,将预测的OD客流和真实值输入到掩码损失函数中训练模型。
考虑到CBAM注意力机制关注的区域是根据识别到的特征自动选择的。其关注的区域可能不包含主要客源信息。为了解决这个问题,作者在模型训练过程中引入了掩码损失函数,使得PSAM-CNN模型能够更加关注PS-OD流。如公式(3)。掩码损失函数仅通过乘以客源系数来考虑预测PS-OD量与实际PS-OD量之间的差异。
(3)
其中表示在第d天时间窗口t上从i到j站的客流真实值,为预测值。为PS-OD对数。考虑过饱和路段随时间变化,计算每个时间窗的客源系数矩阵,如式(4)所示。如果OD对是时间窗t内的PS-OD对,则,否则,。
(4)
结果
(1)确定过饱和路段的乘客来源
作者根据以下步骤确定深圳地铁的过饱和路段:(1)使用Dijkstra算法推断每个乘客行程的路径选择。(2)将乘客出行需求分配到城市地铁网络中。(3)计算每个城市地铁区段的乘客流量。(4)计算每个城市地铁区段的负载比例,并识别出超负荷的区段。如图3所示,深圳地铁的过饱和路段主要分布在早高峰和晚高峰时段的3号线和4号线沿线。大量乘客在早高峰时间前往深圳市中心,在晚高峰时间返回郊区。
图 3 深圳地铁过饱和路段的空间分布
作者使用的是早上8:30到早上9:30采集的智能卡数据。在2016年8月1日,以说明PS-OD对。如图4 (a)所示,每个像素的颜色表示OD对的类型。蓝色和红色所覆盖的区域代表过饱和路段的3054对PS-OD对,而灰色所覆盖的区域则代表未向过饱和路段贡献客流的普通OD对。根据客流量(即PS-OD流量)对PS-OD对进行排序。排名前202位的PS-OD对(红色部分)占PS-OD流量总量的50%以上。可以看出,这些排名靠前的PS-OD对只占城市地铁网络OD对的不到1.2%,表明深圳地铁的主要过饱和是由一小群乘客造成的。从图4(b)中可以看出,PS-OD对主要分布在第3线和第4线,这与过饱和剖面的空间分布非常吻合。
图 4 (a) PS-OD对和普通OD对,(b) PS-OD对的空间分布
(2)PSAM-CNN模型实验
使用30个工作日的乘客出行需求数据来训练和测试PSAM-CNN模型。前27天的数据作为训练集,后3天的数据作为测试集。为了避免过拟合,采用了早停训练技术。提出的PSAMCNN模型使用Adam优化器进行训练。为评价PSAM-CNN模型的性能,使用 RMSE、MAE和MAPE等评价指标。
我们使用PSAM-CNN模型预测了第28、29、30工作日(即测试集)各高峰时段t的PS-OD流量。使用过去五天时间窗口t的OD矩阵作为模型输入。
需要注意的是,PSAM-CNN模型关注的是PS-OD流,因此只用预测的PS-OD流和实际的PS-OD流来评估模型的性能。不考虑普通OD对的客流情况。作者使用Max-Min归一化方法对预测的PS-OD流量和实际PS-OD流量进行归一化处理(图5)。发现在所有高峰时段窗口,预测的PS-OD流量与实际值差异很小,表明了PSAM-CNN模型的有效性。
图 5 在不同的高峰时段,预测的PS-OD流量与实际的PS-OD流量。(a)及(e) 7:30-8:30。(b)及(f) 8:30-9:30。(c)及(g) 17:30-18:30。(d)及(h) 18:30-19:30。
此外,作者定义了乘客源流量(PS-O flow),即是起始于某个站点的PS-OD流量的累积值。PS-O流量衡量了起始于该站点的PS-OD流量的总量,这对于制定针对性的乘客流控制策略非常重要。预测的PS-O流量与真实值之间差异较小如图6所示,进一步说明了PSAM-CNN模型的有效性。只有少数几个站点具有较大的PS-O流量,这表明超负荷区段的乘客流主要起源于少数几个站点。这些结果表明,PSAM-CNN模型在预测PS-OD流量方面具有较好的性能,并且可以为制定针对性的乘客流控制策略提供重要信息。
图 6 不同高峰时段窗下的预测PS-O流量与实际PS-O流量对比
为了进一步证明模型的性能,作者将PSAM-CNN模型与四个基准模型进行比较,即历史平均(HA)模型、CNN模型、卷积长短期记忆(ConvLSTM)模型和RegNetX002模型。每个基准模型(以及PSAM-CNN模型)运行10次以减少随机误差。将10次实验预测的PS-OD流动的平均值作为最终预测结果。如表1所示,PSAM-CNN模型的预测性能最好。
与CNN模型相比,PSAM-CNN模型结合CBAM注意机制和掩码损失函数,引入了基于客源的注意机制。因此,PSAM-CNN模型具有较高的预测精度。ConvLSTM模型的性能最差,可能是因为该模型更适合预测具有严格时间顺序特征的序列。然而,本研究使用的是前5天同一时间窗口的OD客流作为输入,没有明显的时间特征。RegNetX002是基准模型中最复杂的模型,它在预测PS-OD流方面的性能排名第二。然而,考虑到复杂模型通常需要更多的训练数据,有限的训练集在某种程度上影响了模型预测的准确率。
表 1 PSAM-CNN模型与四种基准模型的比较
(3)消融实验
为探究PSAM-CNN模型中CBAM模块和PS-MASK模块的功能。使用三个简化模型进行测试。第一个简化模型是CNN模型,没有PS-MASK掩码损失函数和CBAM注意力,使用普通损失函数。第二个简化模型是CNN-MASK模型,该模型不集成CBAM,而是使用掩码损失函数。第三种简化模型是CNN-CBAM模型,该模型集成CBAM,但使用普通损失函数。三个简化模型与PSAM-CNN模型具有相同的超参数和输入,三个简化模型也与PSAM-CNN模型具有相同的基本结构。在CNN-CBAM模型中,CBAM注意机制也集成在第二池化层的后面。
我们首先分析了CBAM模块的功能。与CNN模型相比,CNN-CBAM模型的RMSE、MAE和MAPE分别降低了2.8%、6.0%和1.8%,结果如下表所示。CNN-CBAM模型在早晚高峰时段的预测精度均高于CNN模型,如图7所示。与提出的PSAM-CNN模型相比,CNN-MASK模型的RMSE、MAE和MAPE分别提高了5.8%、5.2%和2.0%。未集成CBAM模块的CNN-MASK模型在早晚高峰时段的预测精度低于PSAM-CNN模型。这可能是因为CBAM模块可以自适应调整不同信道对预测任务的贡献,自适应地感知和选择特征图的重要区域,从而提高了预测精度。
图 7 PSAM-CNN模型及其三种简化模型在不同时间窗下的性能。
接下来,作者分析了PS-MASK模块的功能。比较结果如表2所示,与CNN模型相比,CNN-MASK模型的RMSE、MAE和MAPE分别降低了1.6%、6.4%和1.9%。然而,在预测晚高峰时段的PS-OD流量时,CNN-MASK模型与CNN模型相比优势可以忽略不计。与PSAM-CNN模型相比,CNN-CBAM模型的RMSE、MAE和MAPE分别提高了4.6%、5.6%和2.0%。缺少PS-MASK模块的CNN-CBAM模型在早晚高峰时段的预测精度低于PSAM-CNN模型。由于掩码损失函数只计算PS-OD流量的RMSE,实际上缩小了模型的重点,更加注重PS-OD流量的预测,因此预测效果更好。
表 2 PSAM-CNN模型及其三种简化模型的比较。
结论
本文建立了一种基于卷积神经网络(PSAM-CNN)的新的客源注意机制模型,以准确预测城市地铁网络的PS-OD流。PSAM-CNN模型利用CNN高效的特征提取能力提取稀疏OD矩阵的重要特征,结合基于客源的注意机制,更好地专注于PS-OD流的预测。作者使用深圳地铁的实际乘客出行需求数据来验证提出的PSAM-CNN模型。验证结果表明,与基准模型相比,PSAM-CNN模型具有更好的预测性能。本文还讨论了提高预测性能的可能原因。
在本文提出的PSAM-CNN模型中,客源分析是将城市地铁过饱和问题与导致过饱和的乘客出行需求预测联系起来的桥梁。作者认为,本研究可以为开发针对部分出行需求的有针对性的预测模型提供有用的见解,这是很重要的,因为许多交通问题实际上是由部分出行需求而不是整体出行需求引起的。目标模型在预测出行需求的关键部分时也能达到更高的预测精度,这与以往旨在提高所有OD对的整体出行需求预测精度的模型不同。
Attention
如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!