网络购物数据分析

news/2025/1/18 13:42:23/文章来源:https://www.cnblogs.com/flyingsir/p/18678404
 
#获取数据
import pandas as pd
infor=pd.read_csv('buy_input_1.csv')
infor.head(20)

 

 

 

   
#选取预观察数据#方法1
# x1=infor["Annual Income"]
# print(x1)
# x2=infor["Spending Score"]
# print(x2)# """
#方法2
# x1=infor.iloc[:,3]
# print(x1)
# x2=infor.iloc[:,4]
# print(x2)
# """#方法3
x1 = infor.loc[:, 'Annual Income']
print(x1)
x2 = infor.loc[:, 'Spending Score']
print(x2)

  

   

 

   

3.进行数据可视化,绘制散点图

   
import matplotlib.pyplot as plt
#保证可以显示中文字体
plt.rcParams['font.sans-serif']=['SimHei']
#正常显示负号
plt.rcParams['axes.unicode_minus']=False#绘制聚类结果2维的散点图
plt.figure(figsize=(8,8))#选取两个数据维度进行可视化(x1,x2)x1维度会呈现在x坐标轴,x2维度会呈现在y坐标轴
plt.scatter(x1,x2,c="red")
plt.xlabel('Age')
plt.ylabel('Spending Score')
plt.title("网络支出")
plt.show()

  

   

 

   

1.数据导入

   
#导入库函数
import pandas as pd
#读取“用户信息”,并预览数据
user_infor=pd.read_csv('./buy_input_1.csv')
user_infor.head(10)

 

   

 

   

2.数据处理

 

2.1选取数据(特征)

   
#剔除样本编号
features_x1=user_infor.drop(['CustomerID'],axis=1)
features_x1.head(10)

  

 

   
#剔除基础信息
features_x1=features_x1.drop(['Gender','Age'],axis=1)
features_x1.head(10)

  

 

   ## 2.2数据可视化
   
#选取预观察数据x1=user_infor["Annual Income"]
print(x1)
x2=user_infor["Spending Score"]
print(x2)

 

#导入库函数
import matplotlib.pyplot as plt#创建图表,并设置属性
plt.figure(figsize=(8,8))plt.title('Annual Income/Spending Score')
plt.xlabel('Annual Income')
plt.ylabel('Spending Score')#选择特征数据(x1,x2)
plt.scatter(x1 ,x2 ,c='red')#显示图表
plt.show()

  

 

   

3.测试算法

 

3.1配置算法(确定K值)¶

   
from sklearn.cluster import KMeans
#进行K-Means聚类分析#修改n_clusters=?
#修改n_init=?
#修改max_iter=?
kmeans=KMeans(n_clusters=2,init='k-means++',n_init=2,max_iter=100,random_state=0)

  

3.2使用算法(计算类别标签)

kmeans.fit(features_x1) #将数据特征喂入模型
label_y1=kmeans.predict(features_x1) #预测类别标签
print(label_y1) #打印类别标签

  

 

3.3计算聚类中心(质心)

centers = kmeans.cluster_centers_ #计算聚类中心
print(centers) #打印聚类中心坐标

  

 

3.4标记聚类中心(质心是否改变)¶

 

import matplotlib.pyplot as plt#创建图表,并设置属性
plt.figure(figsize=(8,8))plt.xlabel('Annual Income')
plt.ylabel('Spending Score')
plt.title('Annual Income/Spending Score')#按类别绘制“用户画像”
plt.scatter(x1,x2, c=label_y1)#标注聚类中心坐标
plt.scatter(centers[:, 0], centers[:, 1], c='red', marker='x')#显示图表
plt.show()

  

 

3.5应用算法

 

kmeans.fit(features_x1) #将数据特征喂入模型
label_y1=kmeans.predict(features_x1) #预测类别标签
print(label_y1) #打印类别标签

  

 

 

   
   
   
   
   
   buy_input_1.csv
   

CustomerID,Gender,Age,Annual Income,Spending Score
1,Male,19,15,39
2,Male,21,15,81
3,Female,20,16,6
4,Female,23,16,77
5,Female,31,17,40
6,Female,22,17,76
7,Female,35,18,6
8,Female,23,18,94
9,Male,64,19,3
10,Female,30,19,72
11,Male,67,19,14
12,Female,35,19,99
13,Female,58,20,15
14,Female,24,20,77
15,Male,37,20,13
16,Male,22,20,79
17,Female,35,21,35
18,Male,20,21,66
19,Male,52,23,29
20,Female,35,23,98
21,Male,35,24,35
22,Male,25,24,73
23,Female,46,25,5
24,Male,31,25,73
25,Female,54,28,14
26,Male,29,28,82
27,Female,45,28,32
28,Male,35,28,61
29,Female,40,29,31
30,Female,23,29,87
31,Male,60,30,4
32,Female,21,30,73
33,Male,53,33,4
34,Male,18,33,92
35,Female,49,33,14
36,Female,21,33,81
37,Female,42,34,17
38,Female,30,34,73
39,Female,36,37,26
40,Female,20,37,75
41,Female,65,38,35
42,Male,24,38,92
43,Male,48,39,36
44,Female,31,39,61
45,Female,49,39,28
46,Female,24,39,65
47,Female,50,40,55
48,Female,27,40,47
49,Female,29,40,42
50,Female,31,40,42
51,Female,49,42,52
52,Male,33,42,60
53,Female,31,43,54
54,Male,59,43,60
55,Female,50,43,45
56,Male,47,43,41
57,Female,51,44,50
58,Male,69,44,46
59,Female,27,46,51
60,Male,53,46,46
61,Male,70,46,56
62,Male,19,46,55
63,Female,67,47,52
64,Female,54,47,59
65,Male,63,48,51
66,Male,18,48,59
67,Female,43,48,50
68,Female,68,48,48
69,Male,19,48,59
70,Female,32,48,47
71,Male,70,49,55
72,Female,47,49,42
73,Female,60,50,49
74,Female,60,50,56
75,Male,59,54,47
76,Male,26,54,54
77,Female,45,54,53
78,Male,40,54,48
79,Female,23,54,52
80,Female,49,54,42
81,Male,57,54,51
82,Male,38,54,55
83,Male,67,54,41
84,Female,46,54,44
85,Female,21,54,57
86,Male,48,54,46
87,Female,55,57,58
88,Female,22,57,55
89,Female,34,58,60
90,Female,50,58,46
91,Female,68,59,55
92,Male,18,59,41
93,Male,48,60,49
94,Female,40,60,40
95,Female,32,60,42
96,Male,24,60,52
97,Female,47,60,47
98,Female,27,60,50
99,Male,48,61,42
100,Male,20,61,49
101,Female,23,62,41
102,Female,49,62,48
103,Male,67,62,59
104,Male,26,62,55
105,Male,49,62,56
106,Female,21,62,42
107,Female,66,63,50
108,Male,54,63,46
109,Male,68,63,43
110,Male,66,63,48
111,Male,65,63,52
112,Female,19,63,54
113,Female,38,64,42
114,Male,19,64,46
115,Female,18,65,48
116,Female,19,65,50
117,Female,63,65,43
118,Female,49,65,59
119,Female,51,67,43
120,Female,50,67,57
121,Male,27,67,56
122,Female,38,67,40
123,Female,40,69,58
124,Male,39,69,91
125,Female,23,70,29
126,Female,31,70,77
127,Male,43,71,35
128,Male,40,71,95
129,Male,59,71,11
130,Male,38,71,75
131,Male,47,71,9
132,Male,39,71,75
133,Female,25,72,34
134,Female,31,72,71
135,Male,20,73,5
136,Female,29,73,88
137,Female,44,73,7
138,Male,32,73,73
139,Male,19,74,10
140,Female,35,74,72
141,Female,57,75,5
142,Male,32,75,93
143,Female,28,76,40
144,Female,32,76,87
145,Male,25,77,12
146,Male,28,77,97
147,Male,48,77,36
148,Female,32,77,74
149,Female,34,78,22
150,Male,34,78,90
151,Male,43,78,17
152,Male,39,78,88
153,Female,44,78,20
154,Female,38,78,76
155,Female,47,78,16
156,Female,27,78,89
157,Male,37,78,1
158,Female,30,78,78
159,Male,34,78,1
160,Female,30,78,73
161,Female,56,79,35
162,Female,29,79,83
163,Male,19,81,5
164,Female,31,81,93
165,Male,50,85,26
166,Female,36,85,75
167,Male,42,86,20
168,Female,33,86,95
169,Female,36,87,27
170,Male,32,87,63
171,Male,40,87,13
172,Male,28,87,75
173,Male,36,87,10
174,Male,36,87,92
175,Female,52,88,13
176,Female,30,88,86
177,Male,58,88,15
178,Male,27,88,69
179,Male,59,93,14
180,Male,35,93,90
181,Female,37,97,32
182,Female,32,97,86
183,Male,46,98,15
184,Female,29,98,88
185,Female,41,99,39
186,Male,30,99,97
187,Female,54,101,24
188,Male,28,101,68
189,Female,41,103,17
190,Female,36,103,85
191,Female,34,103,23
192,Female,32,103,69
193,Male,33,113,8
194,Female,38,113,91
195,Female,47,120,16
196,Female,35,120,79
197,Female,45,126,28
198,Male,32,126,74
199,Male,32,137,18
200,Male,30,137,83

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/871229.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

了解ESP32睡眠模式及其功耗

转载自:https://lastminuteengineers.com/esp32-sleep-modes-power-consumption/ Insight Into ESP32 Sleep Modes & Their Power ConsumptionThe ESP32 is undeniably a worthy competitor to many WiFi/MCU SoCs, outperforming them in both performance and price. Ho…

某公交管理系统简易逻辑漏洞+SQL注入挖掘

某公交管理系统挖掘 SQL注入漏洞 前台通过给的账号密码,进去 按顺序依次点击1、2、3走一遍功能点,然后开启抓包点击4当点击上图的4步骤按钮时,会抓到图下数据包,将其转发到burp的重放模块构造以下注入poc,可见注入延时了五秒,用户输入的语句成功拼接到原有的SQL语句上执行…

记一次常规的网络安全渗透测试

前言 上个月根据领导安排,需要到本市一家电视台进行网络安全评估测试。通过对内外网进行渗透测试,网络和安全设备的使用和部署情况,以及网络安全规章流程出具安全评估报告。本文就是记录了这次安全评估测试中渗透测试部分的内容,而且客户这边刚刚做过了一次等保测评,算一下…

工具 | Hfish

0x00 简介 HFish是一款社区型免费蜜罐。 下载地址 HFish下载: HFish下载 0x01 功能说明支持多种蜜罐服务支持自定义Web蜜罐支持流量牵引支持端口扫描感知能力支持多种告警方式注:仅供安全研究与学习之用,若将工具做其他用途,由使用者承担全部法律及连带责任,作者及发布者不…

ida(持续更新)

如题前缀 说明sub_ 指令和子函数起点locret_ 返回指令loc_ 指令off_ 数据,包含偏移量seg_ 数据,包含段地址值asc_ 数据,ASCII字符串byte_ 数据,字节(或字节数组)word_ 数据,16位数据(或字数组)dword_ 数据,32位数据(或双字数组)qword_ 数据,64位数据(或4字数组)…

工具 | Hashcat

0x00 简介 Hashcat是一款强大的密码破解工具。 下载地址 Hashcat下载: Hashcat下载 0x01 功能说明直接破解组合攻击掩码暴力破解混合攻击联合攻击注:仅供安全研究与学习之用,若将工具做其他用途,由使用者承担全部法律及连带责任,作者及发布者不承担任何法律及连带责任。

深入理解主键和外键:数据库设计的基石

title: 深入理解主键和外键:数据库设计的基石 date: 2025/1/18 updated: 2025/1/18 author: cmdragon excerpt: 在现代信息系统中,数据的管理和存储是至关重要的。关系数据库作为一种广泛使用的数据存储方式,其设计的合理性直接影响到数据的完整性和系统的性能。在关系数据…

一次性讲清如何合理搭配一台组装电脑

今天这篇文章我就给大家一次性讲清,我们如何合理搭配组装一台电脑,新手小白建议收藏观看,希望对大家有所帮助。 1 .首先要知道组装一台电脑, 以下八大硬件缺一不可: 2. 认识【CPU】: CPU品牌: 目前市场主流消费级CPU只有英特尔与AMD。 英特尔CPU: intel的CPU分为i3、i5、i…

ADCP414、ADCP416四通道125MSPS速率ADC替代AD9653、AD9253,可提供ZZKK证明

ADCP416-125/105/80是一款4通道、16位、125/105/80MSPS模数转换器(ADC),内置片内采样保持电路,专门针对低成本、低功耗、小尺寸和易用性而设计。该产品的转换速率最高可达125MSPS,具有杰出的动态性能与低功耗特性,适合比较重视小封装尺寸的应用。ADCP416-125特性和优势 --电…

Linux下使用Git的FQS

Git连接问题报错场景解决办法一:关闭SSL验证git config --global http.sslVerify false

[护网必备]2018年-2024年HVV 6000+个漏洞 POC 合集分享

此份poc 集成了Zabbix、用友、通达、Wordpress、Thinkcmf、Weblogic、Tomcat等 下载链接: 链接: 6000+Poc下载

2025-01-18:施咒的最大总伤害。用go语言,一个魔法师掌握了多种不同的咒语,每个咒语对应一个伤害值,这些伤害值存储在数组 power 中,其中可能会有多个咒语具有相同的伤害值。 使用某个特定伤

2025-01-18:施咒的最大总伤害。用go语言,一个魔法师掌握了多种不同的咒语,每个咒语对应一个伤害值,这些伤害值存储在数组 power 中,其中可能会有多个咒语具有相同的伤害值。 使用某个特定伤害值为 power[i] 的咒语后,魔法师不能再使用伤害值为 power[i] - 2、power[i] - …