ICLR 2024 时间序列相关最新论文汇总,涉及transformer、GNN、大模型等热门领域

ICLR(International Conference on Learning Representations),国际公认的深度学习顶会之一,与AAAI、CVPR、ACL和NIPS等老牌学术会议齐名,由图灵奖巨头Yoshua Bengio和Yann LeCun牵头举办,在人工智能、统计和数据科学以及计算机视觉、语音识别、文本理解等多个重要应用领域中都发表了众多极其有影响力的论文。

本届ICLR 2024会议共收到了7262篇论文,整体接收率约为31%,与去年(31.8%)基本持平。其中Spotlight论文比例为5%,Oral论文比例为1.2%。会议将于2024年5月7日至11日在奥地利维也纳举行,为来自世界各地最杰出的人工智能专家和研究者提供交流平台,共同探讨前沿的深度学习和强化学习领域的最新进展。

本文盘点了 ICLR 2024 有关时间序列领域的最新研究成果,为大家的论文添砖加瓦:

  • transformer:4篇

  • 多层感知机:1篇

  • 图神经网络:1篇

  • 生成模型:4篇

  • 即插即用(与模型无关):1篇

  • LLM大模型:2篇

  • 预训练与表示:3篇

transformer

TACTiS-2: Better, Faster, Simpler Attentional Copulas for Multivariate Time Series

更好、更快、更简单的多元时间序列注意力耦合器

「简述:」论文介绍了一种新的多变量概率时间序列预测模型,旨在灵活地解决一系列任务,包括预测、插值及其组合。基于 copula 理论,作者提出了最近引入的基于 transformer 的注意力 copula(TACTiS)的简化目标,其中分布参数的数量现在与变量的数量成线性关系,而不是成指数关系。新的目标需要引入一个训练课程,这与原始架构的必要更改密切相关。

Periodicity Decoupling Framework for Long-term Series Forecasting

长期序列预测的周期性解耦框架

「简述:」论文提出了一种新的周期性解耦框架(PDF),用于捕捉解耦系列的二维时间变化,进行长期系列预测。该框架由三个组件组成:多周期解耦块、双变量建模块和变量聚合块。与之前的方法不同,该方法主要对二维时间变化进行建模,通过解耦一维时间序列来捕捉。实验结果显示,该方法在预测性能和计算效率方面优于其他最先进的方法。

Multi-scale Transformers with Adaptive Pathways for Time Series Forecasting

用于时间序列预测的具有自适应路径的多尺度transformer

「简述:」Transformer模型在时间序列预测中取得了显著成功。但现有方法主要从固定尺度建模,难以捕捉不同尺度的特征。作者提出了一种新的多尺度变压器模型(Pathformer),它结合了时间分辨率和时间距离进行多尺度建模。该模型通过自适应调整多尺度建模过程,提高了预测准确性和泛化能力。在多个真实数据集上的实验表明,Pathformer不仅超越了其他模型,而且具有较强的泛化能力。

VQ-TR: Vector Quantized Attention for Time Series Forecasting

用于时间序列预测的向量量化注意力

「简述:」作者提出了一种名为VQ-TR的方法,用于时间序列预测。该方法将大型序列映射到离散的表示形式,并将其作为Attention模块的一部分。这使得我们可以在与序列长度成线性关系的较大上下文窗口上进行注意力计算。作者将此方法与其他竞争性的深度学习和经典的单变量概率模型进行比较,并使用各种不同领域的开放数据集的预测指标突出其性能。

多层感知机

TimeMixer: Decomposable Multiscale Mixing for Time Series Forecasting

用于时间序列预测的可分解多尺度混合模型

「简述:」论文提出了一种名为TimeMixer的新方法,用于时间序列预测。该方法利用多尺度混合来分析时间序列中的时序变化,并使用基于多层感知机(MLP)的架构来充分利用解耦的多尺度序列。具体而言,该方法包括过去可分解混合和未来多重预测器混合块,以实现良好的预测性能和运行效率。

图神经网络

Biased Temporal Convolution Graph Network for Time Series Forecasting with Missing Values

具有偏置时间卷积图网络的缺失值时间序列预测

「简述:」论文提出了偏置时序卷积图网络(Biased Temporal Convolution Graph Network)新方法,用于处理缺失值的时间序列预测。该方法能够同时捕捉时间依赖性和空间结构,并在两个精心设计的模块中注入偏差以考虑缺失模式。实验结果表明,该方法在五个真实世界的基准数据集上比现有方法提高了9.93%。

生成模型

Generative Learning for Financial Time Series with Irregular and Scale-Invariant Patterns

用于具有不规则和尺度不变模式的金融时间序列的生成式学习

「简述:」对于金融应用中的深度学习模型,训练数据有限是一个大问题。因为金融时间序列有不规则和尺度不变的特点,很难合成真实数据。作者开发了一个新的生成框架,名为FTS-Diffusion,可以模拟这些特点。这个框架有三个模块:模式识别、基于扩散的生成网络和时序转换模型。实验表明,它生成的金融时间序列与真实数据非常相似,优于其他方法。此外,使用它增强的真实数据,股票市场预测的误差减少了多达17.9%。

MG-TSD: Multi-Granularity Time Series Diffusion Models with Guided Learning Process

具有引导学习过程的多粒度时间序列扩散模型

「简述:」扩散概率模型能够生成高保真样本,因此受到关注。但其在时间序列预测中的稳定性和利用度有待提升。为解决此问题,作者提出了多粒度时间序列扩散(MG-TSD)模型。该模型利用数据中的固有粒度级别作为目标,指导扩散模型的学过程,实现了先进预测性能。此方法不依赖外部数据,适用于多个领域。实验证明,MG-TSD模型优于现有预测方法。

Transformer-Modulated Diffusion Models for Probabilistic Multivariate Time Series Forecasting

用于概率多元时间序列预测的Transformer调制扩散模型

「简述:」Transformer在多元时间序列预测中很常用,但现有方法忽视了预测中的不确定性。作者提出了一种Transformer-Modulated Diffusion Model (TMDM),结合条件扩散生成过程和Transformer,以更精确地预测MTS的分布。TMDM利用Transformer提取历史数据的见解,并捕获扩散过程中的协变量依赖性。作者还引入了新指标来评估不确定性估计。实验证明,TMDM在概率MTS预测中很有效。

Multi-Resolution Diffusion Models for Time Series Forecasting

用于时间序列预测的多分辨率扩散模型

「简述:」论文提出了一种名为多分辨率扩散模型(mr-Diff)的新方法,用于利用时间序列数据的多尺度特性进行预测。该方法通过季节性趋势分解,从时间序列中依次提取细到粗的趋势来进行正向扩散。去噪过程以易到难的非自回归方式进行,首先生成最粗糙的趋势,然后逐步添加更精细的细节,并使用预测到的较粗的趋势作为条件变量。在九个真实世界的时间序列数据集上的实验结果表明,mr-Diff优于最先进的时间序列扩散模型,并且在各种先进的时间序列预测模型之间表现良好或相当。

即插即用(与模型无关)

Rethinking Channel Dependence for Multivariate Time Series Forecasting: Learning from Leading Indicators

重新思考多元时间序列预测中的通道依赖性

「简述:」最近,通道独立方法在多元时间序列预测中表现很好。但是这些方法忽略了利用通道依赖性进行准确预测的机会。本文提出了一种名为LIFT的新方法,该方法利用领先指标提供提前信息,帮助滞后变量进行更准确的预测。实验表明,LIFT可以显著提高预测性能。

LLM大模型

TEST: Text Prototype Aligned Embedding to Activate LLM's Ability for Time Series

文本原型对齐嵌入以激活LLM的时间序列能力

「简述:」论文介绍了两种使用语言模型处理时间序列任务的策略,其中重点介绍了TS-for-LLM方法。该方法通过设计适用于LLM的TS嵌入方法来激活LLM处理TS数据的能力。作者提出了一种名为TEST的方法,它首先将TS进行标记化,然后构建一个编码器,通过实例、特征和文本原型对齐对比来嵌入它们,接着创建提示以使LLM更加开放地接受嵌入,并最终实现TS任务。

Time-LLM: Time Series Forecasting by Reprogramming Large Language Models

通过重新编程大型语言模型进行时间序列预测

「简述:」论文介绍了一种名为Time-LLM的框架,用于重新编程大型语言模型(LLM)以进行一般的时间序列预测。作者提出了一种方法,通过使用文本原型重新编写输入的时间序列来对齐两种模式,并使用Prompt-as-Prefix(PaP)来增强LLM推理时间序列数据的能力。实验结果表明,Time-LLM可以超越最先进的专用预测模型,并在少样本和零样本学习场景中表现出色。

预训练与表示

Towards Enhancing Time Series Contrastive Learning: A Dynamic Bad Pair Mining Approach

增强时间序列对比学习

「简述:」本文研究了时间序列对比学习中存在的两种不良正样本对——噪声正样本对和错误正样本对,它们会影响通过对比学习获得的时间序列表示的质量。作者提出了一种名为动态坏对挖掘(DBPM)的算法,该算法可以识别并减少这些不良正样本对的影响,从而提高模型的性能。该方法不需要可学习的参数,易于使用,已在多个真实世界数据集上进行了实验验证。

Soft Contrastive Learning for Time Series

时间序列的软对比学习

「简述:」论文提出了一种名为SoftCLT的时间序列软对比学习策略,通过引入实例和时间上的对比损失,并使用0到1之间的软分配来对它们进行加权,解决了传统对比学习方法忽略时间序列相关性的问题。该方法简单易用,不需要增加复杂度,实验结果表明在各种下游任务中都表现出色,具有最先进的性能。

Learning to Embed Time Series Patches Independently

学习独立嵌入时间序列补丁

「简述:」本文提出了一种名为“独立嵌入时间序列补丁”的方法,用于学习将时间序列数据转换为低维向量表示。该方法的核心思想是分别对每个时间序列补丁进行嵌入,而不是将整个时间序列作为单个实体进行处理。具体来说,该方法使用卷积神经网络(CNN)来提取每个时间序列补丁的特征,并使用最大池化层来减小特征的维度。然后,该方法使用一个全连接层来将这些特征映射到一个固定长度的向量中,以便于后续的任务处理。与传统的时间序列嵌入方法相比,该方法可以更好地捕捉到时间序列数据中的局部模式和相关性。

 

关注下方《学姐带你玩AI》🚀🚀🚀

回复“ICLR时序”获取全部论文+录用清单

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/422366.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【设计模式】适配器和桥接器模式有什么区别?

今天我探讨一下适配器模式和桥接模式,这两种模式往往容易被混淆,我们希望通过比较他们的区别和联系,能够让大家有更清晰的认识。 适配器模式:连接不兼容接口 当你有一个类的接口不兼容你的系统,而你又不希望修改这个…

finalshell连接linux的kali系统

kali的ssh服务似乎是默认关闭的,笔者在玩CentOS系统时可以直接用finalshell完成连接,但kali不行,需要先手动开启ssh服务。 开启kali的ssh服务 输入【ssh start】命令开启ssh服务,可以用【ssh status】命令查看ssh状态&#xff0c…

性能优化-OpenCL kernel 开发

「发表于知乎专栏《移动端算法优化》」 本文主要介绍OpenCL的 Kernel,包括代码的实例以及使用注意的详解。 🎬个人简介:一个全栈工程师的升级之路! 📋个人专栏:高性能(HPC)开发基础教…

健康160 IPO之路出现“拦路虎”,如何“对症下药”?

自从2015年刮起了“互联网”的风,互联网医疗热被吹至风口浪尖,资本争先追逐。如今行业风口已过,互联网医疗企业上市的热度不降反增。一家健康之路,一家健康160,接连递表港交所。 健康160最早从挂号服务起家&#xff0c…

Android单元测试(五):网络接口测试

温馨提示:如果你不太熟悉单元测试,可以先看下之前四篇基础框架使用。便于你更好的理解下面的内容。 在平日的开发中,我们用后台写好给我们接口去获取数据。虽然我们有一些请求接口的工具,可以快速的拿到返回数据。但是在一些异常情…

LC 对角线遍历

LC 对角线遍历 题目描述: 给你一个大小为 m x n 的矩阵 mat ,请以对角线遍历的顺序,用一个数组返回这个矩阵中的所有元素。 题目实例: 示例一: 输入:mat [[1,2,3],[4,5,6],[7,8,9]] 输出:[…

PaddleOCR封装,在线服务化部署实战(python部署,超新手教程)

OCR,即光学字符识别(Optical Character Recognition),是一种将图像中的文字转换为机器编码文字的技术。这种技术可以识别和转换各种来源的文本,包括扫描文档、照片中的文字、手写笔记等。光学字符识别(OCR&…

B站免费1080P清晰度

免费解锁B站1080P清晰度的视频 扫码登录后即可解锁1080P清晰度 复制想看视频的链接 登录成功后,把需要下载的链接粘贴到网站的搜索框中,点下搜索按钮,就能自动解析视频的下载地址。 有的链接可以直接解析出来 然后可以直接预览或者下载 …

【学习】focal loss 损失函数

focal loss用于解决正负样本的不均衡情况 通常我们需要预测的正样本要少于负样本,正负样本分布不均衡会带来什么影响?主要是两个方面。 样本不均衡的话,训练是低效不充分的。因为困难的正样本数量较少,大部分时间都在学习没有用…

Gradle构建项目报错Unable to start the daemon process

Unable to start the daemon process. This problem might be caused by incorrect configuration of the daemon. For example, an unrecognized jvm option is used. 可能是配置的Java环境太高了,不支持,把java版本降到8就可以了。

Allegro如何导入芯片的Pin Delay?

Allegro在做等长时,需要导入芯片的Pin Delay才能做真正的等长。因为有些芯片内部的引脚本身就是不等长的,例如海思的部分芯片。 那么如何导入芯片的Pin Delay呢? 1、打开约束管理器,点击Properties(属性)→Component(器件)→Pin Properties→General。 在右栏找到芯片U1,…

Spring Boot 4.0:构建云原生Java应用的前沿工具

目录 前言 Spring Boot简介 Spring Boot 的新特性 1. 支持JDK 17 2. 集成云原生组件 3. 响应式编程支持 4. 更强大的安全性 5. 更简化的配置 Spring Boot 的应用场景 1. 云原生应用开发 2. 响应式应用程序 3. 安全性要求高的应用 4. JDK 17的应用 总结 作…