变压器寿命预测(python代码,Logistic Regression模型预测效果一般,可以做对比实验)

1.数据来源官网:Data for: Root cause analysis improved with machine learning for failure analysis in power transformers - Mendeley Data

 点Download All 10kb即可下载数据

2.下载下来后是这样

每一列的介绍:

Hydrogen 氢气;

Oxygen 氧气;

Nitrogen 氮气

Methane 甲烷

Carbon Monoxide (CO) 一氧化碳 (CO)

Carbon Dioxide (CO2) 二氧化碳 (CO2)

Ethylene 乙烯

Ethane 乙烷

Acetylene 乙炔

Dissolved Gas Ratio (DBDS) 溶解气体比率

(DBDS) Power Factor 功率因数

Interfacial Voltage (Interfacial V) 界面电压

(Interfacial V) Dielectric Rigidity 介电刚度

Water Content 水分含量

Health Index 健康指数

Life Expectation 寿命预期

3.本次项目的代码流程

  1. 导入所需的库和模块,包括NumPy、Pandas、Matplotlib、Seaborn等。

  2. 读取数据:从名为"Health index.csv"的CSV文件中读取数据,并对数据进行基本的信息查看和描述统计分析。

  3. 定义了一个名为check的函数,用于检查数据中的缺失值情况,并展示了缺失值的统计信息。

  4. 使用数据可视化工具绘制了箱线图,以检查数据中的异常值。

  5. 根据某些特定条件,找到了数据中一些异常值所在的行。

  6. 绘制了特征之间的相关性热力图,以查看特征之间的线性关系。

  7. 绘制了数据集中各个特征的直方图,用于查看其分布情况。

  8. 使用StandardScaler对数据进行标准化,使特征具有相似的尺度。

  9. 对特定特征进行散点图的绘制,以查看它们与目标变量的关系。

  10. 进行线性回归模型的训练和评估,包括训练集和测试集的划分、模型拟合、预测和性能指标的计算。

  11. 绘制了实际健康指数与预测健康指数的散点图,以可视化模型的性能。

  12. 定义了一个名为Model_Input的字典,包含了特定输入值。

  13. 创建一个包含新输入数据的DataFrame,并将其与原数据合并。

  14. 使用训练好的线性回归模型对新输入数据进行健康指数的预测。

  15. 绘制了实际健康指数与预测健康指数的散点图,以展示模型对新输入数据的预测。

代码的主要过程是加载、探索和分析数据,然后使用线性回归模型对健康指数进行预测,并展示结果的可视化。

4.效果视频

变压器寿命预测(python代码,逻辑回归模型预测效果一般,可以做对比实验)_哔哩哔哩_bilibili 

测试集预测效果图

测试集

 

5.对代码感兴趣的可以关注最后一行

import numpy as np  # 导入NumPy库,用于处理数值计算
import pandas as pd  # 导入Pandas库,用于数据处理和CSV文件的输入/输出操作
import os  # 导入操作系统模块,用于文件路径操作import pandas as pd  # 导入Pandas库
# import pandas_profiling
import numpy as np  # 导入NumPy库
import matplotlib.pyplot as plt  # 导入Matplotlib库,用于绘图
import warnings  # 导入警告模块,用于警告管理
warnings.simplefilter(action='ignore')  # 忽略警告信息
plt.style.use('seaborn')  # 设置绘图风格为Seaborn
import seaborn as sns  # 导入Seaborn库,用于数据可视化
from sklearn.linear_model import LogisticRegression, LinearRegression  # 导入Scikit-Learn中的线性和逻辑回归模型
from sklearn.preprocessing import StandardScaler  # 导入数据标准化模块
from sklearn import preprocessing  # 导入预处理模块
from sklearn.model_selection import train_test_split  # 导入数据集划分模块
from sklearn.linear_model import LinearRegression  # 导入线性回归模型
from sklearn import metrics  # 导入评价指标模块
from sklearn.model_selection import KFold  # 导入K折交叉验证模块
from sklearn.model_selection import cross_val_score  # 导入交叉验证模块#数据集和代码压缩包:https://mbd.pub/o/bread/ZJ6Wkplp

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/109617.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言之const

C语言之const const修饰全局变量 此时全局变量只能使用但是不能修改, 如果直接拿全局变量修改值,编译直接报错 如果使用全局变量的地址修改值,运行时程序异常结束 const修饰普通局部变量 可以读取变量的值 不能直接通过变量进行修改值&a…

[交互]交互的实战问题1

[交互]交互的实战问题1 状态码 431 Request Header Fields Too LargeReferrer Policy: no-referrer-when-downgrade路径参数高并发问题使用场景使用的方法异常情况 状态码 431 Request Header Fields Too Large 最近做项目,遇到一个问题,后台导出表格时…

GeoSOS-FLUS未来土地利用变化情景模拟模型

软件简介 适用场景 GeoSOS-FLUS软件能较好的应用于土地利用变化模拟与未来土地利用情景 的预测和分析中,是进行地理空间模拟、参与空间优化、辅助决策制定的有效工 具。FLUS 模型可直接用于: 城市发展模拟及城市增长边界划定;城市内 部高分…

Java基础篇

目录 1、Java语言有哪些特点 2、面向对象和面向过程的区别 3、八种基本数据类型的大小 4、标识符命名规则 5、Java 关键字 6、访问控制 7、instanceof 关键字的作用 8、final 关键字的作用 9、static 关键字作用 10、transient 关键字的作用 11、try catch final…

Virtualbox中Ubuntu根目录空间不足

现象 Virtualbox中Ubuntu根目录空间不足 解决 动态存储 虚拟机关闭先在虚拟介质管理里把硬盘Size调大开启Ubuntu用Disks或者GParted重新调整分区大小重新启动 步骤参考: https://zhuanlan.zhihu.com/p/319431032 https://blog.csdn.net/ningmengzhihe/article/details/1272…

数据结构与算法:树

目录 树 定义 结构 二叉树 定义 结构 形式 满二叉树 完全二叉树 存储 链式存储结构 数组 孩子节点 父节点 应用 查找 维持相对顺序 遍历 深度优先遍历 前序遍历 中序遍历 后序遍历 广度优先遍历 层序遍历 二叉堆 定义 自我调整 操作 插入加点 删…

408强化(番外)文件管理

有点看不下去书,408,哎好久没看了,死磕数学时完全不想看其他科目,数学分数也尚未质变。 突然想到一个好点子,只看大纲尝试回忆一下这章的内容。 文件就是为了方便用户使用,按名访问而提出的,从…

OPC是通讯协议吗安全性

目录 1 安全防护 1.1 防火墙 1.2 网闸 2 OPC是通讯协议吗 2.1 什么通讯协议 2.2 那么OPC又是什么? OPC官方说明文档 1 安全防护 本文阐述了控制网络以OPC接口接入信息网络应当采用的安全防护。 1.1 防火墙 防火墙是大家熟知的网络安全产品,并被用作控制网…

分布式事务解决方案之可靠消息最终一致性

分布式事务解决方案之可靠消息最终一致性 什么是可靠消息最终一致性事务 可靠消息最终一致性方案是指当事务发起方执行完成本地事务后并发出一条消息,事务参与方(消息消费者)一定能 够接收消息并处理事务成功,此方案强调的是只要消息发给事务参与方最终…

SpringMVC多文件上传

文章目录 一、文件上传1.1 导入pom依赖1.2 配置文件上传解析器1.3 设置文件上传表单1.4 实现文件上传 二、文件下载三、多文件上传四、JRebel的使用 一、文件上传 1.1 导入pom依赖 <commons-fileupload.version>1.3.3</commons-fileupload.version><dependency…

LeetCode(力扣)435. 无重叠区间Python

LeetCode435. 无重叠区间 题目链接代码 题目链接 https://leetcode.cn/problems/non-overlapping-intervals/ 代码 class Solution:def eraseOverlapIntervals(self, intervals: List[List[int]]) -> int:if not intervals:return 0intervals.sort(keylambda x: x[0])co…

关于content-type的理解

一.content-type的结论 告诉后端传过去的数据是什么类型的数据 二.没有请求体 (1)没有请求体的情况下content-type没有意义。 (2):图示 里面是没有请求体的 (3)有请求体的情况 二.常见的三种方式 (1)application/x-www-form-urlencoded(默认) 参数的表现形式: 传递之前可以…