tslearn,一个实用的 Python 库!

更多资料获取

📚 个人网站:ipengtao.com


大家好,今天为大家分享一个实用的 Python 库 - tslearn。

Github地址:https://github.com/tslearn-team/tslearn


在数据科学领域,时间序列分析是一项至关重要的任务,涵盖了诸多领域,如金融、气象、生物学、工业生产等。Python 中的 tslearn 库为时间序列分析提供了丰富的工具和功能,使得用户能够轻松地处理、分析和建模时间序列数据。本文将深入探讨 tslearn 库的特性、用法以及应用场景,并提供丰富的示例代码,帮助更好地理解和应用这一强大工具。

tslearn 是什么?

tslearn 是一个专注于时间序列分析的 Python 库,提供了一系列用于处理时间序列数据的工具和算法。

tslearn 主要特点包括:

  • 提供了丰富的时间序列处理和分析工具,包括距离度量、时间序列降维、时间序列分类和聚类等功能。
  • 支持多种时间序列数据类型和格式,包括等长时间序列、不等长时间序列、多变量时间序列等。
  • 提供了高效的实现和并行计算功能,使得用户能够快速处理大规模时间序列数据。

安装 tslearn 库

要开始使用 tslearn 库,首先需要安装它。

可以通过 pip 来进行安装:

pip install tslearn

安装完成后,就可以开始使用 tslearn 来进行时间序列分析了。

使用示例

1. 加载和可视化时间序列数据

import numpy as np
from tslearn.datasets import UCR_UEA_datasets
import matplotlib.pyplot as plt# 加载数据集
X_train, y_train, X_test, y_test = UCR_UEA_datasets().load_dataset("TwoPatterns")# 可视化部分时间序列数据
plt.figure(figsize=(10, 6))
for i in range(5):plt.subplot(5, 1, i+1)plt.plot(X_train[i].ravel())plt.title("Class: {}".format(y_train[i]))
plt.tight_layout()
plt.show()

2. 时间序列降维和可视化

from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.shapelets import ShapeletModel
from tslearn.shapelets import grabocka_params_to_shapelet_size_dict# 时间序列标准化
scaler = TimeSeriesScalerMeanVariance(mu=0., std=1.)  # 标准化
X_train_std = scaler.fit_transform(X_train)# 训练形状模型
shapelet_sizes = grabocka_params_to_shapelet_size_dict(n_ts=X_train_std.shape[0],ts_sz=X_train_std.shape[1],n_classes=len(set(y_train)),l=0.1, r=1)
shp_clf = ShapeletModel(n_shapelets_per_size=shapelet_sizes,optimizer="sgd", weight_regularizer=0.01,max_iter=200, verbose_level=0)
shp_clf.fit(X_train_std, y_train)# 可视化形状模型
plt.figure(figsize=(10, 6))
for i, sz in enumerate(shapelet_sizes.keys()):plt.subplot(len(shapelet_sizes), 1, i + 1)plt.title("%d shapelets of size %d" % (shapelet_sizes[sz], sz))for shp in shp_clf.shapelets_:if tslearn.utils.common.num_cuts(shp) == sz:plt.plot(shp.ravel())
plt.tight_layout()
plt.show()

3. 时间序列分类

from sklearn.metrics import accuracy_score
from tslearn.neighbors import KNeighborsTimeSeriesClassifier# K最近邻分类器
knn = KNeighborsTimeSeriesClassifier(n_neighbors=1, metric="dtw")
knn.fit(X_train, y_train)# 预测并评估分类器性能
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

tslearn 库的应用场景

Python tslearn 库是一个专门用于处理时间序列数据的强大工具,提供了丰富的功能和算法,适用于多种应用场景。

1. 时间序列分类

时间序列分类是识别时间序列数据中的不同类别或模式的任务,例如识别运动传感器数据中的不同运动类型。

from tslearn.datasets import CachedDatasets
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.shapelets import ShapeletModel, grabocka_params_to_shapelet_size_dict
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")
X_train, X_valid, y_train, y_valid = train_test_split(X_train, y_train, test_size=0.2)# 标准化时间序列
scaler = TimeSeriesScalerMeanVariance()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)# 训练形状模型
shapelet_sizes = grabocka_params_to_shapelet_size_dict(n_ts=X_train.shape[0],ts_sz=X_train.shape[1],n_classes=len(set(y_train)),l=0.1, r=1)
shp_clf = ShapeletModel(n_shapelets_per_size=shapelet_sizes,optimizer="sgd", weight_regularizer=0.01,max_iter=200, verbose_level=0)
shp_clf.fit(X_train, y_train)# 预测并评估分类器性能
y_pred = shp_clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

2. 时间序列聚类

时间序列聚类是将相似的时间序列数据聚集到一起,发现数据中的群集结构和模式的任务,例如识别用户行为数据中的不同行为簇。

from tslearn.clustering import TimeSeriesKMeans
from tslearn.datasets import CachedDatasets# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")# 使用 TimeSeriesKMeans 聚类器
km = TimeSeriesKMeans(n_clusters=3, metric="dtw", verbose=True)
y_pred = km.fit_predict(X_train)# 可视化聚类结果
import matplotlib.pyplot as plt
plt.figure()
for cl in range(3):plt.subplot(3, 1, cl + 1)for i in range(len(X_train[y_pred == cl])):plt.plot(X_train[y_pred == cl][i].ravel(), "k-", alpha=0.3)plt.title("Cluster %d" % (cl + 1))
plt.tight_layout()
plt.show()

3. 时间序列降维

时间序列降维是将高维的时间序列数据降低到低维空间的任务,例如可视化高维传感器数据。

from tslearn.datasets import CachedDatasets
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.utils import to_time_series_dataset
from tslearn.shapelets import ShapeletTransform
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt# 加载数据集
X_train, y_train, X_test, y_test = CachedDatasets().load_dataset("Trace")# 时间序列标准化
scaler = TimeSeriesScalerMeanVariance()
X_train_scaled = scaler.fit_transform(X_train)# 将数据转换为时间序列数据集
X_train_ts = to_time_series_dataset(X_train_scaled)# 应用形状转换器
st = ShapeletTransform(n_shapelets_per_size={20: 5},time_contract_in_mins=0.5)
st.fit(X_train_ts, y_train)# 降维并可视化
X_train_transformed = st.transform(X_train_ts)
X_embedded = TSNE(n_components=2).fit_transform(X_train_transformed)
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y_train)
plt.colorbar()
plt.title("Shapelet transform of the Trace dataset")
plt.show()

总结

通过本文的介绍,对 tslearn 库有了更深入的了解。tslearn 提供了丰富的功能和工具,使得用户能够轻松地处理和分析时间序列数据。无论是在时间序列分类、聚类、降维还是预测方面,tslearn 都能够为用户提供强大的支持,成为时间序列分析的得力助手。希望本文能够帮助大家更好地掌握 tslearn 库的用法,并将其应用到实际的时间序列分析和建模工作中。


Python学习路线

在这里插入图片描述

更多资料获取

📚 个人网站:ipengtao.com

如果还想要领取更多更丰富的资料,可以点击文章下方名片,回复【优质资料】,即可获取 全方位学习资料包。

在这里插入图片描述
点击文章下方链接卡片,回复【优质资料】,可直接领取资料大礼包。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/543087.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

环境变量及其获取和设置

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数 常见环境变量 PATH : 指定命令的搜索路径 HOME : 指定用户的主工作目录 ( 即用户登陆到 Linux 系统中时 , 默认的目录 ) SHELL : 当前 Shell, 它的值通常是 /bin/bash 。 查看环…

2024年短视频矩阵系统源头技术开发商 --- 就315会议主题结束后分析

前言:(禁止抄袭复用本编技术分享) 短视频矩阵315提出的ip开发你的技术团队是不是还在进行? 2024年短视频矩阵系统源头技术开发商 --- 就315会议主题结束后分析,昨天的315主题会议不知道大家都看了吗,接…

pycharm @NotNull parameter ‘module‘ of ...

下载了最新pycharm ,无法启动运行 pycharm或者idea中Run/Debug Python项目报错 Argument for NotNull parameter ‘module‘ of … 解决方案 删除项目根目录的 idea 文件夹 随后重启,重新配置即可

海豚调度系列之:认识海豚调度

海豚调度系列之:认识海豚调度 一、海豚调度二、特性三、建议配置四、名次解释 一、海豚调度 Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过…

吴恩达深度学习笔记:神经网络的编程基础2.5-2.8

目录 第一门课:神经网络和深度学习 (Neural Networks and Deep Learning)第二周:神经网络的编程基础 (Basics of Neural Network programming)2.5 导数(Derivatives)2.6 更多的导数例子(More Derivative Examples&…

【论文笔记合集】Transformers in Time Series A Survey综述总结

本文作者: slience_me 文章目录 Transformers in Time Series A Survey综述总结1 Introduction2 Transformer的组成Preliminaries of the Transformer2.1 Vanilla Transformer2.2 输入编码和位置编码 Input Encoding and Positional Encoding绝对位置编码 Absolute …

opencv安装(C++)并配置vs

准备工作: 1.opencv安装包(此教程使用4.9) 2.visual studio(此教程使用vs2019) opencv安装: 1、下载opencv: 1.1 官网下载:Releases - OpenCV 1.2 百度网盘:链接:https://pan.baidu.com/s/1NpEoFjbbyQJtFD…

nmcli --help(nmcli -h)nmcli文档、nmcli手册

文章目录 nmcli --helpOPTION解释OBJECT解释1. g[eneral]:查看NetworkManager的状态2. n[etworking]:启用或禁用网络3. r[adio]:查看无线电状态(例如,Wi-Fi)4. c[onnection]:列出所有的网络连接…

常见面试题之计算机网络

1. OSI 五层模型(或七层模型)是什么,每一层的作用是什么 应用层:又可细分为应用层、表示层、会话层。其中应用层主要做的工作就是为应用程序提供服务,常见的协议为 HTTP、HTTPS、DNS等;表示层主要做的工作…

【博士每天一篇文献-综述】Brain network communication_ concepts, models and applications

阅读时间:2023-12-1 1 介绍 年份:2023 作者:Caio Seguin,Olaf Sporns印第安纳大学心理与脑科学系 期刊: nature reviews neuroscience 引用量:33 中文翻译参考:https://swarma.org/?p44524 …

网络原理(1)——UDP协议

目录 一、应用层 举个例子:点外卖 约定数据格式简单粗暴的例子 客户端和服务器的交互: 序列化和返序列化 xml、json、protobuffer 1、xml 2、json 3、protobuffer 二、传输层 端口 端口号范围划分 认识知名的端口号 三、UDP协议 端口 U…

软件杯 深度学习 python opencv 动物识别与检测

文章目录 0 前言1 深度学习实现动物识别与检测2 卷积神经网络2.1卷积层2.2 池化层2.3 激活函数2.4 全连接层2.5 使用tensorflow中keras模块实现卷积神经网络 3 YOLOV53.1 网络架构图3.2 输入端3.3 基准网络3.4 Neck网络3.5 Head输出层 4 数据集准备4.1 数据标注简介4.2 数据保存…