KNN算法处理多元分类任务

概述

这个案例还是基于之前的案例进行改造。

之前的案例代码完整如下:

from sklearn.datasets import make_blobs
# KNN 分类器
from sklearn.neighbors import KNeighborsClassifier
# 画图工具
import matplotlib.pyplot as plt
# 数据集拆分工具
from sklearn.model_selection import train_test_split
# 数据分析
import numpy as np# 生成样本数为200,分类为2的数据集
data = make_blobs(n_samples=200, centers=2, random_state=8)
X, y = data# 创建knn分类器
clf = KNeighborsClassifier()
clf.fit(X, y)# 画图
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02), np.arange(y_min, y_max, .02))
z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
z = z.reshape(xx.shape)# 绘制数据集
plt.pcolormesh(xx, yy, z, cmap=plt.cm.Pastel1)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.spring, edgecolor='k')# 把新的数据点用五角星表示出来
plt.scatter(6.75, 4.82, marker="*", c="red", s=200)plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier: KNN")plt.show()# 预测
print(clf.predict([[6.75, 4.82]]))

输出结果如下:
在这里插入图片描述

构造新的数据集

构造一个样本数为500,分类数为5的数据集,然后使用散点图进行可视化:

# 生成样本数为500, 分类数为5的数据集
data2 = make_blobs(n_samples=500, centers=5, random_state=8)
X2, y2 = data2# 用散点图将数据集进行可视化
plt.scatter(X2[:,0], X2[:,1], c=y2, cmap=plt.cm.spring, edgecolor='k')
plt.show()

效果预览如下:
在这里插入图片描述

此时的完整代码如下:

from sklearn.datasets import make_blobs
# KNN 分类器
from sklearn.neighbors import KNeighborsClassifier
# 画图工具
import matplotlib.pyplot as plt
# 数据集拆分工具
from sklearn.model_selection import train_test_split
# 数据分析
import numpy as np# 生成样本数为500, 分类数为5的数据集
data2 = make_blobs(n_samples=500, centers=5, random_state=8)
X2, y2 = data2# 用散点图将数据集进行可视化
plt.scatter(X2[:,0], X2[:,1], c=y2, cmap=plt.cm.spring, edgecolor='k')
plt.show()

X2和y2分别是什么?

此时,X2依旧还是一个二维数组:
在这里插入图片描述

y2是一个一维数组,记录了每一行对应的分类是什么:
在这里插入图片描述

使用KNN训练模型

核心代码:

# 训练模型
clf  = KNeighborsClassifier()
clf.fit(X2, y2)# 画图
x_min, x_max = X2[:,0].min() - 1, X2[:,0].max() + 1
y_min, y_max = X2[:,1].min() - 1, X2[:,1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02), np.arange(y_min, y_max, .02))z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
z = z.reshape(xx.shape)plt.pcolormesh(xx, yy, z, cmap=plt.cm.Pastel1)
plt.scatter(X2[:,0], X2[:,1], c=y2, cmap=plt.cm.spring, edgecolor='k')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier: KNN")
plt.show()

输出结果:
在这里插入图片描述

此时的完整代码如下:

from sklearn.datasets import make_blobs
# KNN 分类器
from sklearn.neighbors import KNeighborsClassifier
# 画图工具
import matplotlib.pyplot as plt
# 数据集拆分工具
from sklearn.model_selection import train_test_split
# 数据分析
import numpy as np# 生成样本数为500, 分类数为5的数据集
data2 = make_blobs(n_samples=500, centers=5, random_state=8)
X2, y2 = data2# 训练模型
clf  = KNeighborsClassifier()
clf.fit(X2, y2)# 画图
x_min, x_max = X2[:,0].min() - 1, X2[:,0].max() + 1
y_min, y_max = X2[:,1].min() - 1, X2[:,1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02), np.arange(y_min, y_max, .02))z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
z = z.reshape(xx.shape)plt.pcolormesh(xx, yy, z, cmap=plt.cm.Pastel1)
plt.scatter(X2[:,0], X2[:,1], c=y2, cmap=plt.cm.spring, edgecolor='k')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier: KNN")
plt.show()

查看模型评分

核心代码:

clf.score(X2, y2)

输出如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/704733.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

dubbo复习:(3) 服务超时时间配置

在dubbo admin中 可以进行类似如下配置 configVersion: v2.7 enabled: true configs:- side: consumeraddresses:- 0.0.0.0parameters:timeout: 55这样配置之后,当服务端响应超过55毫秒时,在服务消费者的控制台就会看到超时信息

Google Chrome GPU渲染抓包

非安全模式启动 "C:\Program Files\Google\Chrome\Application\chrome.exe" --ignore-certificate-errors --allow-running-insecure-content --disable-web-security 配置环境 set RENDERDOC_HOOK_EGL0 "C:/Program Files/Google/Chrome/Application/chrom…

降Compose十八掌之『亢龙有悔』

公众号「稀有猿诉」 原文链接 降Compose十八掌之『亢龙有悔』 Jetpack Compose是新一代的声明式的UI开发框架,由Google在2019年推出,最初是作为Android的新式UI开发框架,但它本质是一个声明式UI开发框架,并不受制于底层的平…

公司邮箱是什么?公司邮箱和个人邮箱有什么不同?

公司邮箱是企业用来收发邮件的专业版电子邮箱,不同于个人邮箱的简单功能和有限的存储空间,公司邮箱的功能更加丰富,能够满足企业的日常办公和协作需求。本文将为您详细讲解公司邮箱和个人邮箱的区别,以供您选择更适合自己的邮箱类…

算术平均数

算术平均数(average)是一组数据相加后除以数据的个数而得到的结果,是度量数据水平的常用统计量,在参数估计和假设检验中经常用到。比如:用职工平均工资来衡量职工工资的一般水平,用平均体重来观察某一人群体…

web学习笔记(五十五)

目录 1. 配置代码片段的步骤 2. 条件判断 2.1 v-if、v-else、v-else-if 2.2 v-show 2.3 v-show和v-if的区别 1. 配置代码片段的步骤 在Visual Studio Code中我们可以将常用的代码配置成代码片段,这样就可以在页面上快速输入大段代码了。 (1&#…

Linux:Figshare网站文件下载(非浏览器)

参考aws亚马逊云下载figshare内容 Linux wget -c 下载网页内容crul -C_figshare怎么下载数据-CSDN博客 尝试一下 mamba search awscli mamba install awscli2.15.48 aws --version通过网页获取下载链接 比如: https://s3-eu-west-1.amazonaws.com/pfigshare-u-…

IO系列(四) - RandomAccessFile 类解读

一、摘要 RandomAccessFile 类,也被称为随机访问文件类。 RandomAccessFile 可以说是 Java 体系中功能最为丰富的文件操作类,相比之前介绍的通过字节流或者字符流接口方式读写文件,RandomAccessFile 类可以跳转到文件的任意位置处进行读写数…

【线性系统理论】笔记三

能控性判别 约当标准型 总结: 秩的判据 能观性判别 秩判据 能控Ⅰ型&能控Ⅱ型 1型 2型 能控性分解&能观型分解

dhcp(接口和全局地址池模式)

接口地址池和全局地址池 dhcp应用 1.全部开启dhcp功能 2.ar5 0口接口地址池 1口全局地址池 3.ar6和ar7配置,查看能否自动获取ip 左右不同两个网络,接口和全局地址池的区别 部分截图 ar6 ar7 ar5

Java面试八股之LinkedHashMap和PriorityQueue的区别是什么

Java中LinkedHashMap和PriorityQueue的区别是什么 LinkedHashMap LinkedHashMap 是 HashMap 的一个子类,继承了 HashMap 的特性,并在此基础上添加了链表结构来维护元素的插入顺序。具体来说,LinkedHashMap 通过将每个条目(entry…

嵌入式开发十四:按键输入实验

前面两个实验,我们介绍了 STM32F4 的 IO 口作为输出的使用,这一次,我们将向大家介绍如何使用 STM32F4 的 IO 口作为输入用。我们将利用板载的 4 个按键,来控制板载的两个 LED 的亮灭和蜂鸣器。通过本次的学习,你将了解…