ICLR 2024 | FTS-Diffusion: 用于合成具有不规则和尺度不变模式的金融时间序列的生成框架

ICLR 2024 | FTS-Diffusion: 用于合成具有不规则和尺度不变模式的金融时间序列的生成框架

原创 QuantML QuantML 2024-04-17 09:53 上海

Content

本文提出了一个名为FTS-Diffusion的新颖生成框架,用于模拟金融时间序列中的不规则和尺度不变模式。这些模式由于其独特的时间动态特性(即模式在持续时间和幅度上的变化重复)而难以用现有方法捕捉。FTS-Diffusion框架由三个模块组成:尺度不变模式识别算法、基于扩散的生成网络以及模式的时间演变建模。通过大量实验,作者证明了FTS-Diffusion能够生成与观测数据高度相似的合成金融时间序列,并在股票市场预测的下游实验中将错误率降低了高达17.9%。据作者所知,这是首次针对金融领域中具有不规则和尺度不变特性的复杂时间序列数据生成问题的研究。

引言:

金融经济研究者已经展示了深度学习在解决金融环境中复杂问题方面的潜力。然而,数据的缺乏和金融数据的低信噪比是阻碍深度学习在金融领域进一步发展的两大障碍。与自然科学不同,金融研究者无法通过实验来获取更多数据,因此金融时间序列受到现有历史的局限。此外,价格和回报数据受到高噪声水平的影响,使得从有限的数据集中提取有用信息变得更加困难。在不足的数据上训练的深度学习模型容易过拟合,不能期望其在未见数据上可靠地表现。

图片

相关工作:

论文回顾了深度生成建模在多个领域生成时间序列数据的进展,特别是变分自编码器(VAEs)、生成对抗网络(GANs)和基于扩散的模型。然而,这些方法在处理具有不规则性和尺度不变性的复杂金融时间序列方面存在挑战。

图片

问题陈述:

金融时间序列中的不规则和尺度不变模式对于假设规律性和均匀性的现有模型来说难以捕捉。论文提出了一个新的框架来模拟这些模式,并将其分解为模式识别、生成和演变三个过程。

FTS-Diffusion框架:

FTS-Diffusion框架是为了生成具有不规则和尺度不变模式的金融时间序列而设计的。这个框架通过分解金融时间序列生成问题为三个主要步骤:模式识别、模式生成和模式演变

图片

1. 模式识别模块 (Pattern Recognition Module)

这个模块的目的是在金融时间序列中识别不规则和尺度不变的模式。为此,论文提出了一种新的算法,称为尺度不变子序列聚类(Scale-Invariant Subsequence Clustering, SISC)。这个算法使用动态时间规整(Dynamic Time Warping, DTW)来处理不同长度和幅度的子序列,并通过贪婪策略来确定最优的分段长度。SISC算法首先通过一个初始化过程来准备候选的聚类中心,然后使用DTW距离来比较候选长度的子序列与聚类中心的距离,从而找到最优的分段。这个过程会迭代进行,直到聚类分配稳定或达到预设的迭代次数。

2. 模式生成模块 (Pattern Generation Module)

这个模块的目标是合成模式的片段。它由两个专门的网络组成:一个扩散网络和一个缩放自编码器(Scaling Autoencoder, AE)。

  • 扩散网络:基于去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM),通过逐步添加噪声(扩散过程)和逐步去除噪声(去噪过程)来模拟模式的生成。去噪过程由一个神经网络近似,该网络学习每一步的去噪梯度。

  • 缩放AE:用于学习可变长度序列与固定长度表示之间的转换。编码器将可变长度的序列拉伸成固定长度的表示,而解码器则从固定长度的表示重构出可变长度的序列。

这两个网络联合训练,使用在模式识别模块中识别出的序列作为训练数据。

图片

3. 模式演变模块 (Pattern Evolution Module)

这个模块负责模拟连续生成的序列片段之间的时间演变。它使用一个马尔可夫链来模型化模式之间的转换状态,包括模式本身、持续时间和幅度。为了捕捉这些状态的时序动态,论文引入了一个模式演变网络,该网络学习给定当前状态的情况下下一个模式的概率以及相应的持续时间和幅度的缩放因子。

合成整个金融时间序列 (Synthesizing Entire Financial Time Series)

FTS-Diffusion将模式视为生成的基本构建块,并基于模式逐个生成合成时间序列。给定一个从历史数据中采样的初始片段,它通过迭代地应用模式生成模块和模式演变模块来生成连续的片段。在每个位置,模式演变网络预测下一个模式及其持续时间和幅度的缩放因子。然后,模式生成模块根据这些状态生成下一个片段。随着更多片段的生成和附加,合成时间序列逐渐增长。这个过程重复进行,直到整个时间序列达到所需的总长度。

图片

数值实验:

作者通过数值实验评估了FTS-Diffusion的性能,并与其他方法进行了比较。实验结果表明,FTS-Diffusion生成的合成金融时间序列在分布上与观测数据高度相似,并且在下游任务中具有实用性。

结论:

论文提出了FTS-Diffusion框架,用于合成具有不规则和尺度不变模式的金融时间序列。通过将金融时间序列生成分解为模式识别-生成-演变过程,并设计了三个专门的模块来实现这一过程。实验结果证实了FTS-Diffusion在合成与观测数据相似的金融时间序列方面的有效性,并为下游任务提供了有用的数据。这是首次在金融领域中生成具有不规则和尺度不变特性的复杂时间序列数据的研究。

论文下载地址:Generative Learning for Financial Time Series with Irregular and Scale-Invariant Patterns | OpenReview

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/636614.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

质谱原理与仪器2-笔记

质谱原理与仪器2-笔记 常见电离源电子轰击电离源(EI)碎片峰的产生典型的EI质谱图 化学电离源(CI)快原子轰击源(FAB)基体辅助激光解析电离(MALDI)典型的MALDI质谱图 大气压电离源(API)电喷雾离子源(ESI)大气压化学电离源(APCI)APCI的正负离子模式 大气压光电离源(APPI) 常见电离…

Mac多媒体播放器 Movist Pro v2.11.4中文激活版下载

Movist Pro for Mac是一款专业的媒体播放器,特别为Mac用户设计。它不仅界面简洁美观,而且功能强大,能满足用户各种播放需求。 Movist Pro v2.11.4中文激活版下载 首先,Movist Pro for Mac支持多种媒体文件的播放,包括视…

微信小程序-长按显示,点击空白区域关闭

<view bind:tap"closeLongAction"><view bind:longpress"openAction></view><view wx:if"{{longActionIsShow}}"> 长按显示的区域 </view> </view>openAction(e) {console.log(322,e);this.setData({longActionI…

第65天:API攻防-接口安全WebPackRESTSOAPWSDLWebService

目录 思维导图 前置知识 案例一&#xff1a;WebService 类-Wsdl&ReadyAPI-SQL 注入 案例二&#xff1a;SOAP 类-Swagger&SoapUI&EXP-信息泄露 案例三&#xff1a;HTTP 类-WebPack&PackerFuzzer-信息泄露 思维导图 前置知识 RPC接口: 登录游戏时候登录账号…

ES中文检索须知:分词器与中文分词器

ElasticSearch (es)的核心功能即为数据检索&#xff0c;常被用来构建内部搜索引擎或者实现大规模数据在推荐召回流程中的粗排过程。 ES分词 分词即为将doc通过Analyzer切分成一个一个Term&#xff08;关键字&#xff09;&#xff0c;es分词在索引构建和数据检索时均有体现&…

Windows 下最好用的流程图软件Visio

keywords: Visio 小问题记录 连接线箭头 如果在 Visio 2013/2016 里画流程图&#xff0c;发现连接线没有箭头&#xff0c;检查一下「设计」菜单里是否将主题设置成了「无主题」&#xff0c;如果是&#xff0c;取消掉就好了。 鼠标悬停提示 把鼠标悬停在图形上四周应该有几…

c++ - 空间申请和释放 new/delete

文章目录 一、c/c内存分布二、new/delete 的使用三、malloc/free 和 new/delete 的对比四、new/delete 的实现原理五、匹配问题 一、c/c内存分布 求下面各个变量的位置 // c/c内存分布int globalVar 1; static int staticGlobalVar 1; void Test() {static int staticVar …

Android开发——Fragment

Demo fragment_blank.xml <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_pare…

Fannel和Calico

一 1、路由器下面每一个端口都是一个vlan,隔离了广播包 192.168.1.0和192.168.2.0他们属于不同的vlan,没有三层交换机或者路由器,他们通不了信 不在同一个vlan,也就是子网,包就会走向网关(也就是路由器那里,路由器有路由表。查看目的地192.168.2.0在b口,从b口出去vlan…

Python编程技巧揭秘:深入理解Lambda函数,如何使用匿名函数简化你的代码

文章目录 1. Lambda函数2. 在实际应用中使用Lambda2.1 使用Lambda函数进行列表排序2.2 在高阶函数中使用Lambda 3. Lambda的局限性和注意点 在这篇文章中&#xff0c;将深入探讨Python中的Lambda函数&#xff0c;这是一种强大的编程工具&#xff0c;可以以更简洁、高效的方式编…

Java基于微信小程序的讲座预约系统的研究与实现,附源码

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

PCDN与边缘计算的集成解决方案

PCDN与边缘计算的集成解决方案 在数字化时代&#xff0c;内容的快速、安全地传递至用户变得至关重要。无论是媒体、教育还是其他领域&#xff0c;所有这些行业都需要强大的技术支持以保证信息的实时更新和安全传输。PCDN&#xff08;Peer Content Delivery Network&#xff0c…