【四 (2)数据可视化之 Matplotlib 常用图表及代码实现 】

目录

    • 文章导航
    • 一、介绍
    • 二、安装Matplotlib
    • 三、导入Matplotlib
    • 四、设置可以中文显示
    • 四、常用图形
      • 1、散点图(Scatter Plot)
      • 2.1、线性图(Line Plot)
      • 2.2、堆叠折线图
      • 2.3、多图例折线图
      • 3.1、柱状图/条形图(Bar Chart)
      • 3.2 堆叠条形图
      • 4、直方图(Histogram)
      • 5、饼图(Pie Chart)
      • 6、箱线图(Box Plot)
      • 7、子图(Subplot)
      • 8、指标卡

文章导航

【一 简明数据分析进阶路径介绍(文章导航)】

一、介绍

Matplotlib是一个Python的2D绘图库,它可以在各种硬拷贝格式和跨平台的交互式环境中生成出版质量级别的图形。它是Python中最常用的可视化工具之一,功能非常强大,可以调用函数轻松地绘制出数据分析中的各种图形,如折线图、条形图、柱状图、散点图、饼图等。

二、安装Matplotlib

pip install matplotlib

三、导入Matplotlib

import matplotlib.pyplot as plt

四、设置可以中文显示

from matplotlib import font_manager    # 设置Matplotlib配置参数
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑体
plt.rcParams['axes.unicode_minus'] = False  # 正确显示负号

四、常用图形

1、散点图(Scatter Plot)

利用坐标点(散点)的分布形态反映特征间的相关关系。常用于展示两个变量之间的关系。

import numpy as np  # 假设我们有一些关于学生分数和学习时间的数据  
scores = np.random.randint(40, 100, size=50)  # 学生分数  
study_hours = np.random.rand(50) * 20  # 学习时间(小时)  plt.figure(figsize=(8, 6))  # 设置图形大小  
plt.scatter(study_hours, scores, color='blue', edgecolor='black', alpha=0.7)  # 绘制散点图  
plt.xlabel('学习时间 (小时)')  
plt.ylabel('分数')  
plt.title('学习时间与分数的关系')  
plt.grid(True)  # 显示网格  
plt.show()

在这里插入图片描述

2.1、线性图(Line Plot)

也称为折线图,用折线连接数据点以展示数据随时间或其他连续变量的变化趋势。

import matplotlib.pyplot as plt  
import numpy as np  # 假设我们有一系列随时间变化的温度数据  
days = np.arange(1, 32)  # 一个月的天数  
temperatures = np.random.uniform(low=10, high=30, size=31)  # 随机生成温度数据  plt.figure(figsize=(10, 5))  
plt.plot(days, temperatures, marker='o', linestyle='-', color='red')  # 绘制线性图  
plt.xlabel('天数')  
plt.ylabel('温度 (°C)')  
plt.title('一个月内的温度变化')  
plt.grid(True)  
plt.show()

在这里插入图片描述

2.2、堆叠折线图

堆叠折线图通常用于展示随时间变化的累计数据,其中每个系列表示一个分类,堆叠在一起表示总的变化趋势

import matplotlib.pyplot as plt  
import numpy as np  
import pandas as pd
# 假设我们有关于不同产品(产品A, 产品B, 产品C)的销售数据,这些数据随时间变化  
dates = pd.date_range(start='2023-01-01', periods=12, freq='M')  # 生成12个月的日期  # 假设数据如下  
sales_data = {  '产品A': np.random.randint(10, 50, size=12),  '产品B': np.random.randint(5, 30, size=12),  '产品C': np.random.randint(20, 60, size=12)  
}  # 计算累计销售数据  
cumulative_sales = {product: np.cumsum(sales) for product, sales in sales_data.items()}  # 绘制堆叠折线图  
fig, ax = plt.subplots()  
colors = ['b', 'g', 'r']  # 为每个产品指定颜色  
bottom = np.zeros(len(dates))  # 初始化底部位置  for i, (product, sales) in enumerate(cumulative_sales.items()):  ax.plot(dates, sales, color=colors[i], label=product)  bottom += sales  # 更新底部位置以进行堆叠  # 添加标题和标签  
ax.set_xlabel('日期')  
ax.set_ylabel('累计销售额')  
ax.set_title('产品累计销售趋势')  
ax.legend()  # 显示图形  
plt.tight_layout()  
plt.xticks(rotation=45)  # 倾斜日期标签以便于阅读  
plt.show()

在这里插入图片描述

2.3、多图例折线图

观察多个图例的变化趋势可以用多图例折线图

import numpy as np  
import matplotlib.pyplot as plt  
import pandas as pd  # 假设我们有一些关于两个不同产品(Product A 和 Product B)的销售数据  
# 创建日期范围  
dates = pd.date_range(start='2023-01-01', periods=12, freq='M')  # 创建一些模拟数据  
np.random.seed(0)  # 为了结果的可复现性  
sales_a = np.random.randint(50, 150, size=len(dates))  
sales_b = np.random.randint(30, 120, size=len(dates))  # 将数据放入 DataFrame 中  
df = pd.DataFrame({  '日期': dates,  '产品A': sales_a,  '产品B': sales_b  
})  # 设置图形的尺寸  
plt.figure(figsize=(10, 6))  # 绘制折线图  
plt.plot(df['日期'], df['产品A'], label='产品A', marker='o', linestyle='-')  
plt.plot(df['日期'], df['产品B'], label='产品B', marker='s', linestyle='-')  # 设置图表的标题和坐标轴标签  
plt.title('销售情况')  
plt.xlabel('日期')  
plt.ylabel('销售额')  # 设置图例位置  
plt.legend(loc='upper left')  # 设置网格  
plt.grid(True)  # 设置日期格式  
plt.gcf().autofmt_xdate()  # 显示图形  
plt.show()

在这里插入图片描述

3.1、柱状图/条形图(Bar Chart)

通过不同高度的长方形条形表示不同类别的数据大小,常用于比较不同类别之间的数据。

import matplotlib.pyplot as plt  # 假设我们有不同类别的产品销售额数据  
categories = ['产品A', '产品B', '产品C', '产品D']  
sales = [1200, 1800, 1000, 1500]  plt.figure(figsize=(8, 6))  
plt.bar(categories, sales, color='green', edgecolor='black')  # 绘制柱状图  
plt.xlabel('产品类别')  
plt.ylabel('销售额')  
plt.title('产品销售额比较')  
plt.xticks(rotation=45)  # x轴标签倾斜  
plt.grid(axis='y', alpha=0.75)  # 仅y轴显示网格,设置网格透明度  
plt.show()

在这里插入图片描述

3.2 堆叠条形图

堆叠条形图常用于展示不同分类下各个子分类的数值总和,以及每个子分类对总和的贡献

import matplotlib.pyplot as plt  
import numpy as np  # 假设我们有关于不同部门(A, B, C)的支出数据,这些支出又分为几个子类别(工资、福利、其他)  
departments = ['部门A', '部门B', '部门C']  
categories = ['工资', '福利', '其他']  # 假设数据如下  
data = {  '部门A': [20, 30, 10],  '部门B': [25, 25, 15],  '部门C': [15, 35, 20]  
}  # 转换数据为适合Matplotlib的格式  
N = len(departments)  
ind = np.arange(N)  # 组的x位置  
width = 0.35       # 条形的宽度  # 初始化堆叠条形图的底部位置  
bottom = np.zeros(N)  # 创建堆叠条形图  
fig, ax = plt.subplots()  
for category in categories:  values = [data[dept][categories.index(category)] for dept in departments]  ax.bar(ind, values, width, bottom=bottom, label=category)  bottom += values  # 更新底部位置以进行堆叠  # 添加标题和标签  
ax.set_xlabel('部门')  
ax.set_ylabel('支出金额')  
ax.set_title('各部门支出分布')  
ax.set_xticks(ind)  
ax.set_xticklabels(departments)  
ax.legend()  # 显示图形  
plt.tight_layout()  
plt.show()

在这里插入图片描述

4、直方图(Histogram)

一种特殊的柱状图,用于展示数据的分布情况,每个柱子表示某一范围内的数据点数量。

import matplotlib.pyplot as plt  
import numpy as np  # 假设我们有一些正态分布的数据  
data = np.random.randn(1000)  plt.figure(figsize=(8, 6))  
plt.hist(data, bins=30, edgecolor='black', alpha=0.7, color='lightblue')  # 绘制直方图  
plt.xlabel('数据值')  
plt.ylabel('频数')  
plt.title('数据分布直方图')  
plt.grid(axis='y', alpha=0.75)  
plt.show()

在这里插入图片描述

5、饼图(Pie Chart)

用扇形的面积表示各部分在总体中所占的百分比,常用于展示数据的比例关系。

import matplotlib.pyplot as plt  # 假设我们有一组关于不同类别支出的数据  
labels = ['食品', '住房', '交通', '娱乐', '其他']  
sizes = [25, 30, 15, 10, 20]  # 各部分所占的百分比  plt.figure(figsize=(8, 6))  
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=140, colors=['#ff9999','#66b3ff','#99ff99','#ffcc99','#c0c0c0'])  # 绘制饼图  
plt.axis('equal')  # 保证饼图为圆形  
plt.title('支出分布饼图')  
plt.show()

在这里插入图片描述

6、箱线图(Box Plot)

一种展示数据分布情况的图形,通过中位数、四分位数等统计量来描绘数据的分布特征。

import matplotlib.pyplot as plt  
import numpy as np  # 假设我们有多组数据,想要比较它们的分布  
np.random.seed(10)  
data1 = np.random.normal(100, 10, 200)  
data2 = np.random.normal(90, 20, 200)  
data3 = np.random.normal(80, 30, 200)  
data4 = np.random.normal(70, 40, 200)  labels = ['组1', '组2', '组3', '组4']  
data = [data1, data2, data3, data4]  plt.figure(figsize=(10, 7))  
plt.boxplot(data, vert=False, patch_artist=True, notch=True, medianprops={'linewidth': 2}, showmeans=True, meanline=True)  # 绘制箱线图  
plt.yticks(range(1, len(labels) + 1), labels)  
plt.xlabel('数据值')  
plt.title('多组数据的箱线图')  
plt.grid(axis='x', alpha=0.75)  
plt.show()

在这里插入图片描述

7、子图(Subplot)

在同一窗口中绘制多个图形,便于比较和展示多组数据。

import matplotlib.pyplot as plt  
import numpy as np  # 创建一些模拟数据  
x = np.linspace(0, 10, 100)  
y1 = np.sin(x)  
y2 = np.cos(x)  # 创建一个图形和一组子图  
plt.figure(figsize=(12, 6))  # 添加第一个子图  
plt.subplot(2, 2, 1)  # 2行2列,第1个子图  
plt.plot(x, y1)  
plt.title('正弦函数')  
plt.xlabel('x')  
plt.ylabel('y')  # 添加第二个子图  
plt.subplot(2, 2, 2)  # 2行2列,第2个子图  
plt.plot(x, y2)  
plt.title('余弦函数')  
plt.xlabel('x')  
plt.ylabel('y')  # 添加第三个子图(共享x轴)  
plt.subplot(2, 1, 2)  # 2行1列,第2个子图(跨两列)  
plt.plot(x, y1, label='sin(x)')  
plt.plot(x, y2, label='cos(x)')  
plt.title('正弦和余弦函数')  
plt.xlabel('x')  
plt.ylabel('y')  
plt.legend()  # 显示图形  
plt.tight_layout()  # 调整子图参数,使之填充整个图像区域  
plt.show()

在这里插入图片描述

8、指标卡

import matplotlib.pyplot as plt  
import numpy as np  # 假设我们有一个百分比值  
percentage = 0.75  # 设置阈值  
threshold = 0.7  # 根据百分比值确定背景颜色  
completed_color = 'green' if percentage >= threshold else 'red'  # 创建一个新的图形  
fig, ax = plt.subplots()  # 绘制一个矩形,表示进度条的背景  
ax.add_patch(plt.Rectangle((0.1, 0.1), 0.8, 0.8, color='lightgrey'))  # 绘制一个矩形,表示已完成的进度  
background_color = 'white' if completed_color == 'green' else 'blue'  # 确保已完成进度与背景色对比度高  
ax.add_patch(plt.Rectangle((0.1, 0.1), 0.8 * percentage, 0.8, color=completed_color))  # 设置文本标签,并调整字体大小  
font_size = 20  # 设置字体大小为20  
ax.text(0.5, 0.5, f'{percentage*100:.0f}%', ha='center', va='center', fontsize=font_size, color='black')  # 移除坐标轴标签和刻度  
ax.set_xticks([])  
ax.set_yticks([])  
ax.set_aspect('equal', adjustable='box')  # 显示图形  
plt.show()

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/542337.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C#】.net core 6.0 使用第三方日志插件Log4net,配置文件详细说明

欢迎来到《小5讲堂》 大家好,我是全栈小5。 这是《C#》系列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对知识点的理解和掌握。…

PostMan测试文件上传

后端代码 package com.example.backend.controller;import cn.hutool.core.io.FileUtil; import cn.hutool.core.util.StrUtil; import com.example.backend.common.Result; import lombok.extern.slf4j.Slf4j; import org.springframework.web.bind.annotation.*; import org…

stm32-定时器输出比较PWM

目录 一、输出比较简介 二、PWM简介 三、输出比较模式实现 1.输出比较框图(以通用定时器为例) 2.PWM基本结构 四、固件库实现 1.程序1:PWM呼吸灯 2.程序2:PWM驱动直流电机 3.程序3:控制舵机 一、输出比较简介 死区生成和互补输出一般…

【计算机网络_传输层】UDP和TCP协议

文章目录 1. 重新理解端口号端口号划分netstat指令pidof 2. UDP协议2.1 UDP协议端格式2.2 UDP的特点2.3 UDP的注意事项2.4 基于UDP的应用层协议 3. TCP协议(传输控制协议)3.1 TCP协议的格式和报头字段3.2 如何解包和分用3.3 理解TCP协议报头3.4 TCP协议的…

一款比 K8S 更好用的编排工具——Nomod

今天给笔友们推荐一款最近发现的服务编排工具Nomad。综合感觉就是功能很强大,姿势很优雅,相比 K8S 更加轻量级,相比 Docker-Compose 能轻松支持分布式。 Nomad 能做什么? Nomad 采用统一的工作流程,既可以轻松部署和管…

基于正点原子潘多拉STM32L496开发板的简易示波器

一、前言 由于需要对ADC采样性能的评估,重点在于对原波形的拟合性能。 考虑到数据的直观性,本来计划采集后使用串口导出,并用图形做数据拟合,但是这样做的效率低下,不符合实时观察的需要,于是将开发板的屏幕…

多模态学习 - 视觉语言预训练综述-2023-下游任务、数据集、基础知识、预训练任务、模型

参考: https://zhuanlan.zhihu.com/p/628840228 https://zhuanlan.zhihu.com/p/628994098 https://zhuanlan.zhihu.com/p/629996372 https://zhuanlan.zhihu.com/p/582424974 多模态学习 - 视觉语言预训练综述-2023-下游任务、数据集、基础知识、模型 1. 多模态介绍…

计算机网络 谢希仁(001-2)

计算机网络-方老师 总时长 24:45:00 共50个视频,6个模块 此文章包含1.5到1.7的内容 1.5计算机网络类别 连通 共享 分类方法 广域网是边缘部分和核心部分的核心部分 以前是拨号连接 现在是光纤 总线型 星型 环形网 1.6计算机网络的性能 带上单位之后就不是…

Java八股文(Element Plus)

Java八股文のElement Plus Element Plus Element Plus 什么是Element UI 和 Element Plus? Element UI 和 Element Plus 是基于 Vue.js 的一套非常受欢迎的开源 UI 组件库,用于快速构建具有现代化设计和丰富交互效果的前端界面。 Element UI 和 Element…

Livox激光雷达 mid360 跑 fastlio2 - 流程记录

mid360 跑 fastlio2 一、配置 mid360 环境1.1、主机配置静态IP为192.168.1.501.2、Livox-SDK21.3、Livox_ros_driver2二、Fast-lio22.1、下载源码2.2、修改代码2.3、编译、运行 一、配置 mid360 环境 1.1、主机配置静态IP为192.168.1.50 1.2、Livox-SDK2 安装工具 sudo apt…

VSCode ARM CortexM 开发

VSCode ARM CortexM 开发: http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_开发/ 文章目录 VSCode ARM CortexM 开发: <http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_%E5%BC%80%E5%…

部署prometheus+Grafana可视化仪表盘监控服务

一、部署prometheus及监控仪表盘 简介 Prometheus是开源监控报警系统和时序列数据库(TSDB)。 Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态&#xff0c;任意组件只要提供对应的HTTP接口就可以接入监控&#xff0c;输出被监控组件信息的HTTP接口被叫做expo…