GMEL:基于地理上下文嵌入的OD流预测

1 文章信息

文章题为“Learning Geo-Contextual Embeddings for Commuting Flow Prediction”,是一篇发表于The Thirty-Seventh AAAI Conference on Artificial Intelligence (AAAI-20)的一篇论文。该论文主要针对交通中OD流预测任务,从地理上下文信息中捕获空间相关性,同时设置多任务学习,确保嵌入表示的有效性,提升模型性能。

2 摘要

基于基础设施和土地利用信息预测起讫点(Origin-Destination, OD)流量对城市规划和公共政策制定至关重要。然而,由于OD流的时空规律较为复杂,因此实现OD流的准确预测是一项具有挑战性的任务。大多数现有的基于机器学习的方法忽略了空间相关性,无法对附近区域的影响进行建模。为解决这些问题,文章提出了地理上下文多任务嵌入学习(GMEL)模型,该模型从地理上下文信息中捕获空间相关性,用于通勤流量预测。具体来说,我们首先构建了一个包含地理上下文信息的地理邻接网络。在此基础上,提出了一种基于图注意网络(GAT)框架的注意机制,用于捕获空间相关性,并将地理上下文信息编码到嵌入空间中。两个单独的服务贸易总协定被用来模拟供给和需求特征。为提高嵌入表示的有效性,文章使用了一个多任务学习框架来引入更强的限制,获得有效的嵌入表示,从而进行流量预测。最后,基于模型所学习的嵌入训练一个梯度增强机(gradient boosting machine),实现OD流预测。文章使用来自纽约市的真实数据集评估我们的模型,实验结果证明了文章提出的方法的有效性。本文的主要贡献如下:

1、文章提出了一个从地理上下文信息中捕获空间相关性的模型(GMEL),并基于图注意力网络将信息编码到嵌入空间中。

2、文章使用来自纽约市的真实世界数据集进行广泛的实验。结果表明GMEL的有效性。

3 基本概念

地理单元:文章将城市划分为N个地理单元76dfb220d98a67f51ae9738ab4b08807.png,例如街道等。

城市指标:城市指标是一个向量,表示地理单元的城市指标特征,描述了地理单元的基础设施和土地利用的汇总信息。

通勤旅行记录(OD)及问题定义:文章用787305d7c802f519fd7cf35ebaed3a5f.png表示通勤旅行记录,其中表示地理单元i和地理单元j之间的通勤流量,即所谓的OD流量。文章旨在利用历史通勤流量(或OD流量)预测未来的通勤流量(或OD流量)。

4 模型结构

86ef42de2fc34d1a448bcb75ff61968b.png

地理语境多任务嵌入学习器(Geo-contextual Multitask Embedding Learner, GMEL):

GMEL旨在从地理环境中捕获空间相关性。GMEL利用图注意网络将地理上下文信息编码到嵌入空间中。为提取蕴含在基础设施和土地使用中的供需特征,GMEL采用两个单独的GAT将地理上下文信息编码到两个不同的嵌入空间中。为了确保嵌入表示的有效性,GMEL采用了多任务学习框架,该框架施加了更强的限制,迫使嵌入封装有效表示,从而实现OD预测。

预测器:结合GMEL学习到的嵌入表示,文章使用GBM(gradient boosting machine)作为回归模型实现OD流域测。

GMEL旨在学习对城市地理单元进行有效嵌入,并对地理上下文信息进行编码。为了分别学习每个地理单元的供给和需求特征,该模型使用两个单独的GAT来编码这些信息。然后将生成的嵌入应用于双线性函数来预测流量。同时,这些嵌入也将应用于两个线性函数来预测地理单元的流入/流出。整体预测损失是三个任务损失的加权和,文章使用反向传播以端到端方式训练GMEL。模型的整体结构如下图所示。

55e468f3944ee9e53d5a390758c45077.png

图注意力网络(GAT):假设第l层中,节点i的状态为84d6a383b26df2b53bcf11a1e672b53c.png,同时地理单元i和地理单元j之间的边特征为0198dc8b1c9d8d1212bc380a18818ac9.png,GAT首先对所有向量进行线性变化,如下式所示。

9de7ec14bd7541670e54a573f6bbe788.png

其中,ba36aaa90e0ea05da31bbf9877a92cd4.png是可学习参数。进一步计算每个边的注意力得分,05e532e9150dfda080ea6d5629f71022.png是可学习参数。

6db035ef55c332791d2d751d92328826.png

进一步,将上述注意力得分通过softmax归一化,并进行汇总求得第l+1层,节点i的状态表示。其中,4a46b5e1bca473e751a1a50024c7c3ea.png是可学习参数。

3839ac642e8ac74e71128fa27f2e7ce6.png

12c85da74e2f6bc21e955468abb18c6d.png

供需特征建模:通勤流量(OD流量)可以被视为供给和需求之间的一种空间互动,文章假设流动是由起源地理单元的供给特征和目的地地理单元的需求特征决定的。文章使用两个单独的GAT网络分别对起点和终点的特征进行提取,并将不同结果进行汇总。

多任务学习:模型包括一个主任务和两个子任务,其中,主任务为预测通勤流量(OD流量),依据两个单独的GAT网络的输出,通过下式计算未来OD流。

ee2306558e107a15035f59ff3a6aba1d.png

对应的损失函数如下。

5dadd2600be5b72298ad764c626afc78.png

子任务为进站流和出站流的预测,文章将进出预测作为两个子任务,即预测每个地理单元的进出站总数。直觉上,通勤流量和进出流量是高度相关的,因此,这两个子任务将对GMEL的训练过程施加更强的限制。同样,分别依据两个GAT模型的输出,分别计算进站流和出站流,如下所示。

500d9bf3c1e161db241d00cde23596e3.png

对应损失函数如下。

8b1a004e3f2f1e9ccead9d7b0ea35b12.png

总损失函数为上述三个任务对应损失的加权求和,如下式所示。其中,不同任务的权重为超参数。

87d73d85cf1d62092edfdbe4bd4459d1.png

模型的训练算法如下所示。

5c2ab03c07d6d7bdacdd7607254c488d.png

5 实验

文章在纽约市的真实数据集上验证了所提出的模型,同时文章使用2010年纽约市人口普查区作为地理单位(总共2168个单位)。对于通勤行程和城市指标,文章使用了以下数据集和方法:(1)OD数据集:LODES,该数据集记录了工人的住所和工作地点,代表了稳定的通勤流量。这些流量被聚合成地理单元级流。在纽约市收集了3031641名通勤者和905837对始发目的地旅行。文章以6:2:2的比例将通勤数据随机分为训练、验证和测试数据集;(2)土地利用数据:PLUTO,该数据集记录了2015年纽约市的土地利用和基础设施信息;(3)OSRM,该方法用于测量人口普查区质心之间的旅行距离。实验结果如下所示。

c2a148258ef1fca8ba083ff7d1a45476.png

进一步,文章为说明利用空间相关性的有效性,绘制了残差图,如下图所示。这些残差图显示了预测和实际流入流量之间的差异,其中红色表示预测值低于真实值,蓝色表示预测值高于真实值,浅蓝色表示预测值和真实值基本一致。GMEL利用地理背景信息捕捉空间相关性,能够考虑到感兴趣区域的特征和附近区域的影响。

3df37dec78c7bc58d82e557bd0fddce9.png

此外,文章还对模型的参数进行分析,如下图所示。包括GAT的层数,嵌入的大小以及多任务学习的权重,如下图所示。值得一提的是,多任务学习权重的最优取值为(0.5,0.5)。

91385c64f6d2e32460ca8dc661d9febc.png

6 总结

本文研究了仅利用基础设施和土地利用信息预测通勤流量的问题,这是城市规划和公共政策制定中的一个基本问题。与传统的重力模型和最近提出的机器学习方法不同,文章提出使用地理上下文信息进行通勤流量预测。为此,文章提出了一种基于图注意网络的端到端嵌入学习框架,用于学习地理单元的地理上下文嵌入。然后将学习到的嵌入输入到梯度增强机器中进行预测。文章利用纽约市的真实数据集进行了广泛的实验。结果表明,引入地理环境信息可以大大提高预测的准确性,并且文章所提出的模型优于所有基线方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/193611.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决向日葵远程控制linux命令行版本无法输入密码的问题

就是如下所示的框,官方说是按方向键↓选择用户名和密码的输入框输入,但是按方向键死活没用,研究了之后按tab键就行了。

如何将vscode和Linux远程链接:

如何将vscode和Linux远程链接: Remote - SSH - 远程登录Linux 安装Remote - SSH 我们下载完后,就会出现这些图标 这里点一下号 查看一下我们的主机名,并复制 输入ssh 用户名主机名 这里是要将ssh这个文件要放在主机下的哪个路径下&#xff…

漆包线工厂生产管理MES系统解决方案

漆包线行业老板痛点: 1.漆包线比较传统的行业,一般都是靠人工去管理,老板想及时知道工厂的生产,销售、出入库、库存情况; 2.型号多称重打印易错,没有系统前 :称重打印,出入库&…

数据结构【DS】串

朴素模式匹配算法的时间复杂度是多少? 最坏的时间复杂度为:𝑶(𝒎𝒏) KMP算法的时间复杂度是多少? 最坏的时间复杂度为:𝑶(𝒎𝒏)求next数组的时间复杂度为&…

UDS 14229-1定义的请求的响应行为

UDS服务响应规则 重要提示服务器一般响应行为包含子功能的请求响应行为物理寻址请求功能寻址请求 没有子功能参数的服务响应行为物理寻址客户端请求功能寻址客户端请求 伪代码示例 重要提示 服务应当支持物理寻址方式请求,部分服务也支持功能寻址方式请求。在功能寻…

PS学习笔记——移动工具

文章目录 介绍文档内移动文档间移动 介绍 移动工具:用于移动图层中的对象,并且同一图层中的所有对象都将一起移动 选中移动工具后,选项栏中会出现“显示变换控件”,勾选后即可看见图层中的对象周围出现边框,可以进行缩…

C++之内建函数对象

C之内建函数对象 算术仿函数 #include<iostream> using namespace std; #include<functional>//内建函数对象头文件 //内建函数对象 算术仿函数void test() {// negate 一元仿函数 取反仿函数negate<int>n;cout << n(100) << endl;//plus 二元仿…

详细步骤记录:持续集成Jenkins自动化部署一个Maven项目

Jenkins自动化部署 提示&#xff1a;本教程基于CentOS Linux 7系统下进行 Jenkins的安装 1. 下载安装jdk11 官网下载地址&#xff1a;https://www.oracle.com/cn/java/technologies/javase/jdk11-archive-downloads.html 本文档教程选择的是jdk-11.0.20_linux-x64_bin.tar.g…

LangChain 代理 Agent(学习笔记)

原文&#xff1a;LangChain 代理 Agent(学习笔记) - 尘叶心繁的专栏 - TNBLOG LangChain 代理 Agent(学习笔记) LangChain 代理 Agent(学习笔记) 简介Agent Zero-shot ReActStructured Input ReActOpenAI FunctionsConversationalSelf ask with searchReAct document storePlan…

07.webpack的性能优化 -- 产出代码

目标&#xff1a; 体积更小合理分包&#xff0c;不重复加载速度更快&#xff0c;使用内存更小 实现功能 小图片的base64编码提取公共代码bundle加hashIngorePlugin懒加载使用CDN使用productionScope Hosting 1. 使用production module.exports smart(webpackCommonConf, …

cesium雷达扫描(模糊圆效果)

cesium雷达扫描(模糊圆效果) 1、实现思路 使用ellipse方法加载圆型,修改ellipse中‘material’方法重写自己的glsl来实现当前效果 1、示例源码 index.html <!DOCTYPE html> <html lang="en"><head><!<

Halcon (3):窗体常用语法使用

文章目录 文章专栏视频资源前言halcon图像使用加载图片示例绘制常用图像批量批注绘制 文章专栏 Halcon开发 视频资源 机器视觉之C#联合Halcon 前言 在使用halcon的算子之前&#xff0c;我们要先学会如何在图片上面进行标注。因为我们不仅要导出处理的结果&#xff0c;还要导出…