商务与经济统计案例分析:3-1Pelican 商店——python 实现

商务与经济统计案例分析:3-1Pelican 商店

  • 要求
  • Python实现

要求

1.净销售额的描述统计量和各种不同类型顾客的净销售额的描述统计量。
2.关于年龄与净销售额之间关系的描述统计量。

Python实现

0.相关分析:2-1案例
1.净销售额的描述统计量和各种不同类型顾客的净销售额的描述统计量。

import pandas as pd
import numpy as np
import matplotlib.pyplot as pltdata = pd.read_csv("F:\DataAnalysis\StatisticForBusinessAndEconomics\PelicanStores\PelicanStores.csv")
data.head()

在这里插入图片描述

data['Net Sales'].describe()

在这里插入图片描述
从上面描述统计量中可以得出,该数据的样本量为100,其中最小净销售额为13.23,最大净销售额为287.59,平均净销售额是77.600500,该值大于第二四分位数(中位数)59.705000,有可能是因为受极大值影响,所以下面分别看一下净销售额的分布及箱型图:

分布条形图:

bin=[0,20,40,60,80,100,120,140,160,180,200,220,240,260,280,300]
data['GroupbyNetSales']=pd.cut(data['Net Sales'],bin,right=False,labels=['20','40','60','80','100','120','140','160','180','200','220','240','260','280','300'])
frequency=data['GroupbyNetSales'].value_counts()
x=list(frequency.sort_index().index)
y=list(frequency.sort_index().values)
plt.style.use('ggplot')
plt.bar(x=x,height=y,width=0.6)
plt.title('净销售额分布条形图')
plt.xlabel('')
plt.ylabel('频数')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()

在这里插入图片描述
通过分布条形图可以看出,净销售额的分布出现左偏的现象,通过箱型图可以查找异常值:

plt.boxplot(x=data["Net Sales"],patch_artist=True,   # 是否要自定义颜色showmeans=False,     # 是否显示均值点boxprops={"color": "black", "facecolor": "c"},    # 箱体的颜色属性,color:边框色,facecolor:填充色flierprops={"marker": 'o', "markerfacecolor": "darkorange", "color": "black", "alpha": 0.8},  # 异常值的颜色属性,color:轮廓颜色,marker:标记形状,markerfacecolor:填充色medianprops={"linestyle": "--", "color": "black"})   # 中位线颜色属性,linestyle:线型,color:线的颜色
plt.show()

在这里插入图片描述
可以得出净销售额在180以上的数据为“异常数据”。

#查看各种不同类型顾客的净销售额的描述统计量。
table2 = data.pivot_table(values=["Net Sales"], index=["Type of Customer"], aggfunc=[np.mean,np.median,np.std,np.amin,np.amax], fill_value=0)
table2

在这里插入图片描述
从结果来看,促销用户的最小净销售额要小于普通用户的净销售额,促销用户最大净销售额要大于普通用户的净销售额,促销用户的净销售额标准差也大于普通用户的净销售额标准差,促销用户的离散程度比较高,又因为促销用户的净销售额被一些极大值的影响,提高了促销用户净销售额的平均值

#查看各类型用户的净销售额和的占比
data1=data.groupby(by=['Type of Customer'] )['Net Sales'].agg(np.sum)
sizes =list(data1[0:])
labels = list(data1.index)
colors = [ 'lightskyblue', 'lightcoral']
plt.pie(sizes,  labels=labels, autopct='%1.1f%%', colors=colors,shadow=True, startangle=110)

在这里插入图片描述
从总净销售额占比来看,促销用户的总销售额占总净销售额的76%。

2.关于年龄与净销售额之间关系的描述统计量。

plt.scatter(data['Age'], Data['Net Sales'])plt.title('Age and Net Sales')
plt.xlabel('Age')
plt.ylabel('Net Sales')plt.tight_layout()
plt.show();

在这里插入图片描述
通过散点图不容易看出这两个变量之间的关系,下面看一下年龄和净销售额的协方差及皮尔逊积矩相关系数:

np.cov(data['Age'], data['Net Sales'])

array([[ 153.48848485, -7.33488889],
[ -7.33488889, 3098.58537045]])

X = np.stack((data['Age'], data['Net Sales']), axis=0)# 每一行作为一个变量
np.corrcoef(X)

array([[ 1. , -0.01063589],
[-0.01063589, 1. ]])
通过计算两个变量之间的协方差可得知年龄和净消费额之间是负相关,进一步的通过皮尔逊相关系数可以得出这两个变量之间是弱相关

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/256515.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EasyRecovery2024免费永久版手机数据恢复软件

EasyRecovery2024是一款操作安全、用户可自主操作的数据恢复方案,它支持从各种各样的存储介质恢复删除或者丢失的文件,其支持的媒体介质包括:硬盘驱动器、光驱、闪存、硬盘、光盘、U盘/移动硬盘、数码相机、手机以及其它多媒体移动设备。能恢…

长城之上的无人机:文化遗产的守护者

长城之上的无人机:文化遗产的守护者 在八达岭长城景区,两架无人机分别部署在了长城的南、北楼两点。根据当前的保护焦点和需求,制定了5条无人机综合巡查航线,以确保长城景区的所有开放区域都能得到有效监管。每天,无人…

Dockerfile详解#如何编写自己的Dockerfile

文章目录 前言编写规则指令详解FROM:基础镜像LABEL:镜像描述信息MAINTAINER:添加作者信息COPY:从宿主机复制文件到镜像中ADD:从宿主机复制文件到镜像中WORKDIR:设置工作目录 前言 Dockerfile是编写docker镜…

017 OpenCV 向量机SVM

目录 一、环境 二、SVM原理 三、完整代码 一、环境 本文使用环境为: Windows10Python 3.9.17opencv-python 4.8.0.74 二、SVM原理 OpenCV中的向量机(SVM)是一种监督学习算法,用于分类和回归分析。它通过找到一个最优的超平…

【数据库】树形数据组织架构下的封锁并发控制,B树索引并发访问控制,树协议原理及案例分析

数据库并发访问树协议 ​专栏内容: 手写数据库toadb 本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。 本专栏会…

【react】动态页面转换成html文件下载,解决样式问题

需求 今天遇到一个需求,挺恶心人的,将一个在线文档页面,可以导出成为html页面查看。 看到网上有使用fs模块,通过react的ReactDOMServer.renderToStaticMarkup将组件转成html字符串,输出文件了。 但是我尝试了&#x…

JM中ref_pic_list_modification bug记录

问题描述 今天在用JM对YUV420p编码时,发现编出的码流用ffplay播放花屏,报如下错误: JM的版本时19.1,没有使能B帧,PicOrderCntType设置为2,其它都是encoder.cfg中的默认配置。我用一些码流分析工具播放H264码流正常,用一些播放器播放也都存在花屏,不过大多数播放器都是…

基于springboot + vue的社区医院信息系统

qq(2829419543)获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:springboot 前端:采用vue技术开发 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件&#xf…

北京市经信局局长姜广智带队调研三六零 强调大模型应与行业结合

12月6日,北京市经济和信息化局局长姜广智、副局长王磊带队走访调研三六零集团,就共促城市级数字安全基础设施项目落地,打造引领行业发展标杆项目,推动大模型落地应用赋能产业、行业发展等话题进行交流。360集团创始人周鸿祎接待来…

电脑系统重装Win10专业版操作教程

用户想给自己的电脑重新安装上Win10专业版系统,但不知道具体的重装步骤。接下来小编将详细介绍Win10系统重新安装的步骤方法,帮助更多的用户完成Win10专业版的重装,重装后用户即可体验到Win10专业版系统带来的丰富功能。 准备工作 1. 一台正常…

RabbitMQ-学习笔记(初识 RabbitMQ)

本篇文章学习于 bilibili黑马 的视频 (狗头保命) 同步通讯 & 异步通讯 (RabbitMQ 的前置知识) 同步通讯:类似打电话,只有对方接受了你发起的请求,双方才能进行通讯, 同一时刻你只能跟一个人打视频电话。异步通讯:类似发信息&#xff0c…

mysql怎么优化查询?

从多个维度优化,这里的优化维度有四个:硬件配置、参数配置、表结构设计和SQL语句及索引。 其中 SQL 语句相关的优化手段是最为重要的。 一、硬件配置 硬件方面的优化可以有 对磁盘进行扩容、将机械硬盘换为SSD,或是把CPU的核数往上提升一些&…