关于如何快速通过期末考试--线性回归

news/2024/12/18 12:41:05/文章来源:https://www.cnblogs.com/AnnaStore/p/18614606

本篇文章更多的是解决期末考试的问题。

本人主要学习计算机图形学,而并非机器学习,在机器学习中也有很多不足不懂之处,也是还在学习,但不是个人重点方向。

这里我们不再讲解原理,直接套路性的教大家如何通过我们(仅我们学校)的期末考试。

当然,我依然希望大家能更多的理解其中的原理再来学习。

先看完整代码我们再进行解析式的去理解

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt# 读数据 数据预处理
data = np.loadtxt("aqi2.csv", delimiter=",", skiprows=1, dtype=np.float32)
index = np.ones((data.shape[0], 1))
data = np.hstack((data, index))# 切片
X = data[:, 1:]
y = data[:, 0]# 划分训练集和测试集
train_x, test_x, train_y, test_y = train_test_split(X, y, train_size=0.8)# 创建线性回归模型
model = LinearRegression()# 训练模型
model.fit(train_x, train_y)# 预测
y_pred = model.predict(test_x)# 截距
intercept = model.intercept_
print("截距:", intercept)# 权重(线性回归系数)
weights = model.coef_
print("权重:", weights)# 绘制实际值和预测值的图像
plt.plot(range(len(test_y)), test_y, c='red', alpha=0.5, label='Actual')
plt.plot(range(len(y_pred)), y_pred, c='green', alpha=0.5, label='Predicted')
plt.legend()
plt.show()

套路都是这几步 

step1-读取数据

 
data = np.loadtxt("aqi2.csv", delimiter=",", skiprows=1, dtype=np.float32) 

//这里的意思是

delimiter表示每个数据直接插入, 即假设 1 2 之间插入 1,2 这样才符合python list的标准范式

skiprows表示跳过行数,因为我们的cvs文件很大概率是没用的,可能是序列 123456 ,这种数据没有任何意义。

dtype=np.float32表示数据类型。这里我们以32位浮点数为标准。

step2 - 切片


# 切片
X = data[:, 1:]
y = data[:, 0]

这里我不再赘述,请看之前的文章

划分训练集和测试集


# 划分训练集和测试集
train_x, test_x, train_y, test_y = train_test_split(X, y, train_size=0.8)

这是几乎我们机器学习代码都会做的事情,这里train_size=0.8表示分割。

# 创建线性回归模型
model = LinearRegression()# 训练模型
model.fit(train_x, train_y)

预测


# 预测
y_pred = model.predict(test_x)

根据题目需求运算模型和提取相应数据

创建模型

# 创建线性回归模型
model = LinearRegression()# 训练模型
model.fit(train_x, train_y)

权重和结截距

# 截距
intercept = model.intercept_
print("截距:", intercept)# 权重(线性回归系数)
weights = model.coef_
print("权重:", weights)

这样 你的程序已经能得到一定分数了,起码比一片空白来的好的多,是吧?

最后我们绘制曲线,这里我不再赘述

# 绘制实际值和预测值的图像
plt.plot(range(len(test_y)), test_y, c='red', alpha=0.5, label='Actual')
plt.plot(range(len(y_pred)), y_pred, c='green', alpha=0.5, label='Predicted')
plt.legend()
plt.show()

这里我们总结一下,实际上我们一般来说就这么几步实现我们的大模型训练 

读取数据->数据切片(分好类)->划分训练集->根据需求改变大模型->预测->根据需求提取数据->end

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/854758.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大学微积分 AB 第四单元:区分的语境应用

(先略)根据上下文解释导数的含义 定的。

欢迎 PaliGemma 2 – 来自 Google 的新视觉语言模型

我们很高兴迎来 Google 全新的视觉语言模型 PaliGemma 2,这是 PaliGemma 的一个新版本。与其前代产品一样,PaliGemma 2 使用强大的 SigLIP 进行视觉处理,但在文本解码部分升级到了最新的 Gemma 2。 模型规模和输入分辨率 PaliGemma 2 提供了新的预训练模型,参数规模包括 3B…

Win11 OneDrive 报错 0x8004def5

突然发现我运行了8万多小时的硬盘报 C5 警告了…抓紧换了块硬盘懒得重装系统直接pe下把文件拷贝到新盘启动后 OneDrive 报错 0x8004def5…参考下:https://www.minitool.com/news/onedrive-error-code-0x8004def5.html简单判断我这个肯定没那么复杂肯定是直接拷贝文件造成的配…

Linux 网页管理工具cockpit使用

无意间在网上看到一款使用比较方便的Linux网页管理工具,感觉很强大,对Linux新手很有用。 平时centos用的比较多,一下以centos7为例,简单列出部署过程。 Cockpit 包通常在 EPEL仓库中提供,需要先下载epel源 yum install -y epel-release.noarch yum clean all yum makecach…

BOE(京东方)“向新2025”年终媒体智享会首站落地上海 六大维度创新开启产业发展新篇章

12月17日,BOE(京东方)以“向新2025”为主题的年终媒体智享会在上海启动。正值BOE(京东方)新三十年的开局之年,活动全面回顾了2024年BOE(京东方)在各领域所取得的领先成果,深度解读了六大维度的“向新”发展格局,同时详细剖析了BOE(京东方)在智能制造领域的领先实践…

如何用管理计划软件制定并落实新年规划,提升团队效率

一、年度规划的重要性 1.1 为什么需要年度规划? 无论是个人职业规划、部门目标还是公司的战略计划,年度规划为每个目标的实现提供了清晰的路线图。一个好的年度规划能够帮助团队明确年度任务,优化资源分配,提高工作效率,并且提供可量化的标准来衡量成果。 具体来说,年度规…

搭建overleaf

1.领取免费服务器,推荐免费服务器(SanFengYun)见下图。2.安装宝塔面板,配置内网为127.0.0.1,访问外网地址。 3.可以在宝塔面板一键部署网站,输入自己的域名即可。 4.关键:安装docker,安装yum,设置github可以访问。 5.更换docker镜像,自带镜像无法访问 6.按照overleaf…

Linux服务器中ping时出现“未知的名称或服务”或“Name or service not known”的解决办法

ping qyapi.weixin.qq.com Name or service not known【背景】接入企业微信时遇到服务器上ping qyapi.weixin.qq.com,报错Name or service not known 【解决办法】 1、# vi /etc/resolv.conf 增加一行 nameserver 8.8.8.82、重启网络 # service network restart3、验证ping成功…

组件 画线渲染 拖尾

了解属性 挂载脚本 还可以设置开始颜色宽度结束颜色等补充

画线渲染 拖尾

了解属性 挂载脚本 补充

LLaMA (以LLaMA2为例,文末附加对比1 2 3 三个版本的变化)

一、背景 LLaMA 2 和 LLaMA2-Chat 参数规模:70亿、130亿和700亿 数据和训练规模: 上下文长度 训练资源 性能表现: 二、预训练 pretraining 1. 预训练数据训练语料来自公开课用的数据源,不包括Meta的产品或服务数据在2万亿个数据tokens上进行了训练对真实的数据源进行…

手把手教会你电脑端如何长截屏~

如果在电脑端想拿到这样的长截图,教你一个方法,不需要下载软件 首先需要先下载一个小插件 需要下载滚动截屏所需的插件 然后解压 zip 包 下载好插件后,对 .zip 包进行解压,解压后文件夹里面有个 .crx 后缀的离线安装包,大致如下图所示:打开扩展程序管理菜单 接下来,打开…