Stack模块的设置

news/2024/11/8 22:57:47/文章来源:https://www.cnblogs.com/GraphL/p/18530926

TEAM: Topological Evolution-aware Framework for Traffic Forecasting–Extended Version

Motivation

为了捕捉复杂的时空动态,许多基于深度学习的方法最近被提出,并由于其学习非线性动力学[35,59]的能力,在挑战数据集上显示出了有希望的结果。这些方法通常建立在图神经网络(GNNs)[16,32]和时间神经网络(TCNs)[24,50]上,分别捕获空间和时间信息。虽然取得了具有竞争力的性能,但这些方法面临着两个挑战。
然而,现有的方法假设输入是固定拓扑道路网和静态交通时间序列。这些假设与城市化不一致,城市化的时间序列被不断收集,道路网络随着时间的推移而演变。在这种情况下,深度学习模型需要频繁的重新初始化和再训练,从而造成了很高的计算成本。

据我们所知,这是第一个能够对不断发展的注册网络进行交通预测的研究。我们有四项贡献。首先,我们提出了在演化的神经网络中的交通预测问题。其次,我们提出了CAST,一个交通预测框架,其中主模型可以使用混合体系结构有效地学习小规模数据。第三,我们提出了一个持续学习模块,使预测模型能够有效地学习进化的rn。然后,我们将该模块集成到CAST中,形成团队。第四,我们报告了广泛的实证研究,这些研究提供了对所提出的框架的相关设计特性的见解,并提供了证据,表明所提出的框架能够优于最先进的方法w.r.t.准确性和运行时。

Challenge

数据更新的问题 (数据冲突 + 数据遗忘)

首先,交通预测是一项长期的任务,由于道路网(RNs)图结构的变化,交通行为可能会随时间发生变化。例如,代表城市的注册护士经常会扩张,以支持城市化造成的人口增长。这将导致新的节点和边被添加到现有的rn中。同时,旧的道路和区域可能会过时,从而消除现有注册网络的节点和边缘。此外,在一些国家,道路经常被封锁,方向经常根据工作日而改变。诸如此类的观察可以解决具有演化拓扑的r网络的流量预测问题
另一种适应不断进化的注册护士的方法是在历史区域上训练一个模型,然后将学习到的知识转移到一个新的模型中,该模型将根据来自更新的注册护士部分的数据进行进一步训练。然而,直接使用已转移的模型面临着两个限制。(i)一个节点的历史和新的时间数据可能不会表现出类似的模式,因为流量数据的演变和表现出数据移动特征[5,55]。传输的模型不能学习历史数据和新数据之间的不一致模式,因此表现出不合格的性能。此外,当RN的拓扑发生变化时,新拓扑对应的流量行为会偏离之前的行为。在这里,被转移的模型捕获的空间依赖关系可能不再合适。(ii)有用的信息,如被转移的模型捕获的稳定模式,可能在转移后被遗忘,而不是被合并的[9]。忘记了稳定模式的模型可能会经历不合格的性能。

增量更新的困难

这段文字描述的挑战主要在于 交通预测模型的高成本和数据规模限制。具体来说:

  1. 高成本:构建和维护交通预测模型需要大量资源,特别是在处理大规模数据集时。
  2. 小数据集的局限性:在实际应用中,为了降低成本,模型通常只在更新区域进行训练。然而,用于更新模型的数据量通常较小,难以捕捉交通网络的复杂时空依赖关系。
  3. 模型的能力不足:现有研究大多关注提高预测精度,缺乏在小规模数据上有效学习复杂非线性时空相关性的能力。

结论:更有效的训练方法应能够 在小数据集上增量式地捕捉动态、复杂的时空相关性。这种方法可以通过知识迁移的方式更新模型,而不必完全重新训练,从而降低训练成本并提升模型在小规模数据上的表现。

结合持续学习 (历史当中最稳定的数据 + 差异最大得数据 + 新的数据)

为了在不危及模型准确性的情况下实现更有效的训练,我们提出了包含卷积和注意力的拓扑进化感知框架(TEAM),用于交通预测。这种机制的组合能够更好地适应新收集的时间序列,同时能够保持从旧时间序列中学到的知识。TEAM具有一个基于瓦瑟斯坦度量的持续学习模块,它作为一个缓冲区,可以识别最稳定和变化最大的网络节点。然后,在整合模型时,只使用与稳定节点相关的数据进行再训练。此外,只使用新节点及其相邻节点的数据以及与变化节点相关的数据来重新训练模型。

我们提出了一个用于交通预测的拓扑进化感知框架(TEAM)来解决上述两个问题。为了解决第一个问题,我们提出了一个采用基于排练的持续学习机制的持续学习模块。该模块作为一个缓冲区工作,并存储有限数量的历史数据样本。然后,该模块被集成到交通预测框架中,当新数据与历史数据相似时,它提供存储的样本,以强制预测模型排练。通过排练,巩固了历史知识,和模式可以减轻遗忘。如果新数据与历史数据不同(即显示分布位移[20]),那么历史知识就不再有用,因此没有必要进行排练。

为了度量历史数据和新数据之间的差异,我们将历史数据和新数据转换为两个直方图,并使用瓦瑟斯坦度量来计算它们的相似性。一些具有高相似性的历史图节点(即最稳定的节点)的有限数量的历史数据样本被选择并存储在缓冲区中。此外,还选择相似性最低的节点(即变化最大的节点),用新数据进行更新。由最稳定的节点、变化最大的节点和新增的节点构造出一个新的邻接矩阵。最后,将缓冲区中的数据和新的邻接矩阵的演化数据作为训练传输模型的输入。所构造的邻接矩阵明显小于整个RN的邻接矩阵。因此,模型训练的复杂性就大大降低了。

为了克服第二个问题,我们提出了一个模型,称为时空卷积注意(CAST),该模型使用一种混合架构,结合了卷积和注意模块用于空间和时间计算。现有的研究表明,卷积和注意力相结合可以使模型学习得更快,更容易收敛,因此模型可以在小规模数据集上很好地工作。杂交卷积和注意力也使模型能够更好地建模动态和非线性的时空相关性。此外,卷积侧重于局部模式,如季节性,变化w.r.t.时间方面,和闭邻居节点w.r.t.空间方面的[42]。相比之下,注意力集中在全球模式上,如趋势w.r.t.时间方面和远邻节点w.r.t.空间方面的[12]。通过结合卷积和注意力,我们的目标是获得一个模型,利用局部和全局模式,以产生更好的精度

方案的深度概括

在这段文字中,提出了两个主要问题,并分别提出了解决方案。具体如下:

问题 1:道路网络(RN)拓扑结构的演变

交通预测是一个长期任务,由于城市化、道路封闭和道路方向变动等原因,交通网络的拓扑结构会随着时间发生变化(例如新节点和边的增加或删除)。现有的预测模型大多假设道路网络是静态的,无法适应这种动态变化。尽管可以通过重新初始化和重新训练模型来应对变化,但这样会导致较高的存储和计算成本。

解决方案
为了解决这个问题,提出了一个 持续学习模块。该模块使用基于复习的持续学习机制,将部分历史数据样本存储在缓冲区中。当新数据与历史数据相似时,通过复习巩固历史知识,以减轻遗忘的影响;当新数据与历史数据不同(即分布发生变化)时,不进行复习。通过 Wasserstein度量 比较历史和新数据的相似性,挑选出相似度较高(即最稳定的节点)和变化最大的节点,将它们分别存储或更新。此外,使用稳定节点、变化节点和新节点构建新的邻接矩阵,使用缓冲区中的数据和演变后的新数据训练模型。这种方法显著减少了模型训练的复杂性。

问题 2:小规模数据集上的复杂时空依赖学习

在实际应用中,由于训练数据和模型维护的成本较高,模型通常只能在较小的数据集上进行更新。然而,现有的交通预测模型主要集中在大规模数据上的高精度预测,而缺乏在小规模数据集上捕捉复杂非线性时空相关性的能力。

解决方案
为了解决这个问题,提出了一个名为 CAST(卷积注意力时空模型) 的混合架构模型,结合了卷积和注意力模块来同时处理空间和时间信息。卷积可以捕捉局部模式(如季节性、时间变化以及临近节点),而注意力则能够关注全局模式(如趋势和远邻节点)。通过卷积和注意力的结合,模型可以同时利用局部和全局模式,在小规模数据集上实现更快的学习和收敛,增强对动态、非线性时空依赖的建模能力。

总结

  • 问题 1:道路网络拓扑的动态变化

    • 解决方案:设计了基于复习的持续学习模块,通过缓冲历史数据并使用Wasserstein度量来选择稳定和变化节点构建新邻接矩阵,从而降低训练成本并减轻遗忘。
  • 问题 2:小规模数据集上复杂时空依赖的学习

    • 解决方案:提出了CAST模型,采用卷积和注意力混合架构来捕捉局部和全局的时空模式,以提高模型在小规模数据集上的表现。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/829077.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CCPC辽宁省赛赛后总结

2024CCPC辽宁省赛-赛后总结 ​ 写这篇的时候已经是11/8日了,过了半个多星期才开始写,我实在堕落,啊对对对。 ​ 这算是acm生涯中真正意义上的首场了,本来是奔着首银摄金的目标去的,结果拿了个铜尾,导致我们小队闹得不是很愉快,所以来写下这篇总结来避免下次犯错。ps:滚榜…

C++之endl以及它与换行符的区别

看下C++_primer上的一段话,并给予解释:1. endl 是操纵符 在 C++ 中,endl 是一种特殊的操纵符(manipulator),它的作用不仅是结束一行(相当于换行),还会刷新缓冲区。操纵符是一种可以影响输出行为的特殊值,比如 endl、setw 等。 题外话 想要了解更多关于setw的内容,可…

C++之fixed

在 C++ 中,fixed 是一个操纵符(manipulator),用于指定浮点数的显示格式。 在默认情况下,C++ 会使用科学计数法或定点(小数点)格式输出浮点数,具体取决于数值的大小和有效位数。 然而,当使用 fixed 时,它会强制所有浮点数都以定点格式显示,即以小数点后的固定位数输出…

MyBatis如何关闭一级缓存(分注解和xml两种方式)

MyBatis如何关闭一级缓存(分注解和xml两种方式)@目录问题:为什么有缓存什么场景下必须需要关闭一级缓存关闭一级缓存方法(针对使用MyBatis场景)第1种:注解形式(可指定仅仅某个Mapper关闭注解)第2种:sql动态拼接传入的随机数 问题:为什么有缓存 mybatis默认开启一级缓存 什…

记录一下 Win11 下自编译 Ollama 本地运行 llama3.1

运行环境Windows 11(显卡 AMD Radeon RX 6650 XT)VS Code(用于查找特定代码,在 gfx1030 附近添加 gfx1032)GitGo 版本 $ go version go version go1.23.3 windows/amd64MinGW (编译需要 make 命令) $ make -v GNU Make 4.4.1 Built for x86_64-w64-mingw32 Copyright (C) …

记录一下 Win11 下编译 Ollama 本地运行 llama3.1

记录一下 Win11 下自编译 Ollama 本地运行 llama3.1 运行环境Windows 11(显卡 AMD Radeon RX 6650 XT)VS Code(用于查找特定代码,在 gfx1030 附近添加 gfx1032)GitGo 版本 $ go version go version go1.23.3 windows/amd64MinGW (编译需要 make 命令) $ make -v GNU Make …

解决Mac M芯片 Wireshark 运行rvictl -s 后,出现Starting device failed

前言 mac os big sur 之后,苹果系统的安全性能提升,导致 rvictl -s 创建虚拟网卡失败。 $ rvictl -s 000348120-001621w21184C01E bootstrap_look_up(): 1102Starting device 000348120-001621w21184C01E [FAILED]这是由于 rvictl 需要开启系统扩展才能使用,但是 M 芯片的 M…

2024-2025-1 20241312 《计算机基础与程序设计》第7周学习总结

|这个作业属于哪个课程|2024-2025-1-计算机基础与程序设计| |这个作业要求在哪里|2024-2025-1计算机基础与程序设计第七周作业| |这个作业的目标|①数组与链表 ②基于数组和基于链表实现数据结构 ③无序表与有序表 ④树 ⑤图 ⑥子程序与参数| |作业正文|https://www.cnblogs.co…

Oracle 存储过程分页 + Sqlsugar调用

一、Oracle 存储过程分页1 create PROCEDURE GetPatientVisitData(2 p_HospId IN VARCHAR2, -- 院区编码3 p_strDate IN VARCHAR2, -- 开始日期4 p_endDate IN VARCHAR2, -- 结束日期5 p_page_size IN NUMBER, -- 每页记录数6 p_page_number IN NUMBER, --…

初次使用 Jetbrains Rider 编写 C#(.Net) 代码

Jetbrains Rider 使用前段时间,Jetbrains公司 公布了 Rider IDE 对非商业用途免费,看到很多业界的朋友都用到这个IDE,今天便下载下来使用一下。 1、界面的差异 Rider的界面跟我前段时间学习调试安卓代码的 Android Studio 的界面很像,布局几乎是一样的。 使用习惯了 Visua…

这些实时互动 AI 场景正在涌现生长,也预示着多模态 AI 的未来|RTE2024 声网CEO赵斌演讲实录

10月25日,在 RTE2024 第十届实时互联网大会主论坛上,声网创始人兼 CEO 赵斌发表了《实时互动十年:从 WebRTC 到生成式 AI 时代的 RTE 》主旨演讲。赵斌认为,生成式 AI 正在驱动 IT 行业发生大变革,这一趋势主要体现在四个层面:终端、软件、云以及人机界面。在这样的时代背…