TSFresh(基于可扩展假设检验的时间序列特征提取)是一个专门用于时间序列数据特征自动提取的框架。该框架提取的特征可直接应用于分类、回归和异常检测等机器学习任务。TSFresh通过自动化特征工程流程,显著提升了时间序列分析的效率。
自动化特征提取过程涉及处理数百个统计特征,包括均值、方差、偏度和自相关性等,并通过统计检验方法筛选出具有显著性的特征,同时剔除冗余特征。该框架支持单变量和多变量时间序列数据处理。
TSFresh工作流程
TSFresh的基本工作流程包含以下步骤:首先将数据转换为特定格式,然后使用
extract_features
函数进行特征提取,最后可选择性地使用
select_features
函数进行特征选择。
TSFresh要求输入数据采用长格式(Long Format),每个时间序列必须包含唯一的
id
标识列。
https://avoid.overfit.cn/post/5730b6960bca45f9b89ce5393afb7005