对鸢尾花进行分类预测-----pycharm

项目说明

#项目:  对鸢尾花进行分类预测
#实例数量150个(3类各50个)
#属性数量:4(数值型,数值型,帮助预测的属性和类)
#特征:花萼长度,花萼宽度,花瓣长度,花瓣宽度  单位:厘米
#类别:山鸢尾,变色鸢尾,维吉尼亚鸢尾

导包

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier,export_graphviz

用KNN算法对鸢尾花进行分类

def knn_iris():"""用KNN算法对鸢尾花进行分类:return:""""""1.获取数据"""iris = load_iris()"""2.数据集划分"""# train_test_split(要分割的数据集【可以是一个或多个数组,每个数组代表一个特征或标签】,测试集的大小,训练集的大小,随机数种子【用于控制数据的随机分割】,是否在分割数据前进行洗牌)# 把iris.data和iris.target按照相同的随机种子6进行随机分割,生成训练集和测试集x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)      # 此处数据集划分不一样对结果影响不一样,划分为6时,准确率约为0.92#x_train【训练模型的鸢尾花数据集的特征】,x_test【测试模型的鸢尾花数据集的特征】,y_train【训练集标签】,y_test【测试集标签】#X_train 中的数据是来自原始 X 数据集的随机选择的 6 行数据,而 X_test 中的数据则是剩下的 2 行数据。# 这种分割方法确保了训练集和测试集的数据是随机且保持了原始数据的分布特性,从而可以用来训练模型和评估模型的泛化能力""" 3.特征工程:无量纲化(标准化)"""transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)     #用训练集特征中的平均值和标准差对测试集数据进行标准化#print("无量纲化后的x_train:\n",x_train)#print("无量纲化后的x_test:\n",x_test)"""4.训练    KNN预估"""estimator = KNeighborsClassifier(n_neighbors=3)estimator.fit(x_train,y_train)"""5.模型评估"""#方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n",y_predict)print("y_test:\n",y_test)print("直接比对真实值和预估值是否一样:\n",y_test == y_predict)#方法2:计算准确率score = estimator.score(x_test,y_test)print("准确率为:\n",score)return Noneif __name__ == "__main__":# 用KNN算法对鸢尾花进行分类knn_iris()

效果:
在这里插入图片描述

KNN算法加入网格搜索交叉验证

def knn_iris_gscs():"""用KNN算法对鸢尾花进行分类,添加网格搜索交叉验证:return:""""""1.获取数据"""iris = load_iris()"""2.数据集划分"""x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=6)""" 3.特征工程:无量纲化(标准化)"""transfer = StandardScaler()x_train = transfer.fit_transform(x_train)x_test = transfer.transform(x_test)  # 用训练集特征中的平均值和标准差对测试集数据进行标准化# print("无量纲化后的x_train:\n", x_train)# print("无量纲化后的x_test:\n", x_test)"""4.训练    KNN预估"""estimator = KNeighborsClassifier(n_neighbors=3)"""5.网格搜索交叉验证"""#参数准备param_dict = {"n_neighbors":[1,3,5,7,8,11]}estimator = GridSearchCV(estimator,param_grid=param_dict,cv=10)estimator.fit(x_train,y_train)"""6.模型评估"""# 方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n", y_predict)print("y_test:\n", y_test)print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)# 方法2:计算准确率score = estimator.score(x_test, y_test)print("准确率为:\n", score)print("最佳参数:\n",estimator.best_params_)print("最佳结果:\n",estimator.best_score_)print("最佳估值器:\n",estimator.best_estimator_)print("交叉验证结果:\n",estimator.cv_results_)return None
if __name__ == "__main__":# 用KNN算法对鸢尾花进行分类,添加网格搜索和交叉验证knn_iris_gscs()

效果:
在这里插入图片描述

决策树算法对鸢尾花进行分类

def decision_iris():"""用决策树对鸢尾花进行分类:return:""""""1.获取数据"""iris = load_iris()"""2.划分数据集"""x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)"""3.决策树预估器"""estimator = DecisionTreeClassifier(criterion="entropy")  #按entropy信息增益进行分类estimator.fit(x_train,y_train)"""4.模型评估"""# 方法1:直接比对真实值和预估值y_predict = estimator.predict(x_test)print("y_predice:\n", y_predict)print("y_test:\n", y_test)print("直接比对真实值和预估值是否一样:\n", y_test == y_predict)# 方法2:计算准确率score = estimator.score(x_test, y_test)print("准确率为:\n", score)return Noneif __name__ == "__main__":#用决策树对鸢尾花进行分类decision_iris()

效果
 决策树算法对鸢尾花进行分类结果

决策树对鸢尾花分类可视化

先保存树的结构到dot文件
在这里插入图片描述
方法def decision_iris()末尾加入代码运行

 #可视化决策树
export_graphviz(estimator,out_file="iris.tree.dot")

在这里插入图片描述

然后可以在线可视化dot文件或者下载可视化工具可视化决策树

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/439931.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】类和对象(一)

💗个人主页💗 ⭐个人专栏——C学习⭐ 💫点击关注🤩一起学习C语言💯💫 目录 导读1. 面向对象2. 类2.1 类的定义 3. 类的访问限定符4. class与struct定义类的区别5. 类的封装6. 类的作用域7.类的实例化8. 类的…

C语言菜鸟入门·判断语句(if语句、if...else语句、嵌套if语句)详细介绍

目录 1. if语句 2. if...else语句 3. if...else if...else 语句 4. 嵌套if语句 C 语言把任何非零和非空的值假定为 true,把零或 null 假定为 false。 语句描述if语句一个 if 语句 由一个布尔表达式后跟一个或多个语句组成。if...else语句一个 if 语句 后可跟…

MySQL解决 恢复从备份点到灾难点之间数据(不收藏找不到了)

CSDN 成就一亿技术人! 今天分享一期 mysql中 备份之后发生灾难造成数据丢失 那么如何恢复中间的数据呢? 数据库数据高于一切(任何数据是不能丢失的) CSDN 成就一亿技术人! 目录 1.准备测试数据库 2.备份数据库 观…

vue 使用 v-viewer 用于图片浏览的Vue组件,支持旋转、缩放、翻转等操作,基于viewer.js。

作者连接 npm: npm install v-viewerlegacy viewerjs main.js 引入: // 引入Viewer插件 import VueViewer, { directive as viewerDirective } from v-viewer; // 引入Viewer插件的图片预览器的样式 import viewerjs/dist/viewer.css; // 使用Viewer图片…

动手学RAG:汽车知识问答

原文:动手学RAG:汽车知识问答 - 知乎 Part1 内容介绍 在自然语言处理领域,大型语言模型(LLM)如GPT-3、BERT等已经取得了显著的进展,它们能够生成连贯、自然的文本,回答问题,并执行…

SSE长连接( SpringBoot整合SSE(Server-Sent Events)可以实现后端主动向前端推送数据)

Demo代码分享 依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.or…

记录一次腾讯云服务器部署宝塔

一、查看是否安装 宝塔面板 bt 14 1 已安装会列出宝塔登录地址&#xff1b; 否则-bash: bt: command not found&#xff1b; 下载及安装命令&#xff08;这条是目前最新的宝塔安装命令&#xff09; yum install -y wget && wget -O install.sh http://download.bt.cn/…

常见的网络安全威胁和防护方法

随着数字化转型和新兴技术在各行业广泛应用&#xff0c;网络安全威胁对现代企业的业务运营和生产活动也产生了日益深远的影响。常见的网络安全威胁通常有以下几种&#xff1a; 1. 钓鱼攻击 攻击者伪装成合法的实体&#xff08;如银行、电子邮件提供商、社交媒体平台等&#xf…

ASPICE--汽车行业过程评估/参考模型

近几年&#xff0c;汽车行业飞速发展&#xff0c;尤其是是新能源汽车&#xff0c;试图完全颠覆传统汽车行业的风格&#xff0c;多家企业喊出“软件定义汽车”“软件智能一体化”等类似的口号。由此可见&#xff0c;软件在新类型的汽车设计中占有独一无二的领导地位&#xff0c;…

【webrtc】‘ninja.exe‘ 不是内部或外部命令,也不是可运行的程序及vs2019 重新构建m98

werbtc 就是用ninja.exe 来构建找到了自己以前构建的webrtc 原版 m98 【m98 】webrtc ninja 构建 、example、tests 及OWT- P2P 项目P2PMFC-E2E-m98G:\CDN\rtcCli\webrtc-checkout\src找到了自己的deptools的路径 deptools里确实没有ninja.exe D:\SOFT\depot_tools\third_party…

【Django开发】前后端分离美多商城项目:项目准备和搭建(附代码,文档)

本系列文章md笔记&#xff08;已分享&#xff09;主要讨论django商城项目开发相关知识。本项目利用Django框架开发一套前后端不分离的商城项目&#xff08;4.0版本&#xff09;含代码和文档。功能包括前后端不分离&#xff0c;方便SEO。采用Django Jinja2模板引擎 Vue.js实现…

考研经验总结——英语篇

文章目录 一、前言二、刷题情况三、关于背诵四、建议五、大作文模板作文词汇一、图画类作文1.1 para.1 description 远景近景&#xff08;倒装分词结构&#xff09;1.2 para.2 interpretation (两正一反或一正一反)1.3 para.3 comment 二、柱线饼表2.1 line chart 双柱对比图线…