【Python】进阶学习:pandas--describe()函数的使用介绍

🐍【Python】进阶学习:pandas——describe()函数的使用介绍
在这里插入图片描述

🌈 个人主页:高斯小哥
🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希望得到您的订阅和支持~
💡 创作高质量博文(平均质量分92+),分享更多关于深度学习、PyTorch、Python领域的优质内容!(希望得到您的关注~)


🌵文章目录🌵

  • 📊 一、初识`describe()`函数
  • 📈 二、`describe()`函数的基本用法
  • 🔍 三、定制`describe()`函数的输出
  • 📊 四、`describe()`函数与数据可视化
  • 💡 五、深入理解统计指标
  • 📚 六、总结与进阶学习
  • 🤝 七、期待与你共同进步

📊 一、初识describe()函数

  在数据分析和处理的过程中,我们经常需要了解数据的基本统计信息,如均值、标准差、最小值、最大值等。pandas库中的describe()函数为我们提供了这样的功能,它可以快速生成数据集的描述性统计信息。

📈 二、describe()函数的基本用法

  describe()函数是pandas库中DataFrame和Series对象的一个方法,它默认返回以下统计信息:

  • count:非空值的数量
  • mean:平均值
  • std:标准差
  • min:最小值
  • 25%:第一四分位数(Q1)
  • 50%:第二四分位数(中位数,Q2)
  • 75%:第三四分位数(Q3)
  • max:最大值

使用示例:

import pandas as pd# 创建一个简单的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函数
description = df.describe()
print(description)

输出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
25%    2.000000  2.000000  20.000000
50%    3.000000  3.000000  30.000000
75%    4.000000  4.000000  40.000000
max    5.000000  5.000000  50.000000

🔍 三、定制describe()函数的输出

  describe()函数提供了多个参数,允许我们定制输出的统计信息。

  • percentiles:指定要包括的其他百分位数,例如percentiles=[.25, .5, .75]将返回第一、第二和第三四分位数。
  • include:指定要包括的数据类型,默认为'all',可以设置为'all', 'nums', 或 'object'
  • exclude:指定要排除的数据类型。

使用示例:

import pandas as pd# 创建一个简单的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函数定制输出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)

输出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
30%    2.200000  2.200000  22.000000
50%    3.000000  3.000000  30.000000
60%    3.400000  3.400000  34.000000
90%    4.600000  4.600000  46.000000
max    5.000000  5.000000  50.000000

📊 四、describe()函数与数据可视化

  describe()函数输出的统计信息经常与数据可视化结合使用,以更直观地了解数据的分布。例如,我们可以使用matplotlib库来绘制箱线图(boxplot)。

使用示例:

import pandas as pd
from matplotlib import pyplot as plt# 创建一个简单的DataFrame
data = {'A': [1, 2, 3, 4, 5],'B': [5, 4, 3, 2, 1],'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)# 使用describe()函数定制输出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)# 绘制箱线图
df.boxplot()
plt.show()

效果展示:

在这里插入图片描述

💡 五、深入理解统计指标

  了解describe()函数输出的统计指标对于正确解读数据至关重要。例如,标准差可以告诉我们数据集的离散程度,中位数则可以告诉我们数据集的中心趋势,而不受极端值的影响。

📚 六、总结与进阶学习

  describe()函数是pandas库中非常实用的一个函数,它可以帮助我们快速了解数据集的基本统计信息。通过定制输出、结合数据可视化以及深入理解统计指标,我们可以更好地分析和处理数据。在进阶学习中,你还可以探索其他与describe()函数相关的统计方法和可视化工具,以提高你的数据处理和分析能力。

希望这篇博客能帮助你更好地理解和使用pandas中的describe()函数!🚀📈🔍

🤝 七、期待与你共同进步

  🌱 亲爱的读者,非常感谢你每一次的停留和阅读!你的支持是我们前行的最大动力!🙏

  🌐 在这茫茫网海中,有你的关注,我们深感荣幸。你的每一次点赞👍、收藏🌟、评论💬和关注💖,都像是明灯一样照亮我们前行的道路,给予我们无比的鼓舞和力量。🌟

  📚 我们会继续努力,为你呈现更多精彩和有深度的内容。同时,我们非常欢迎你在评论区留下你的宝贵意见和建议,让我们共同进步,共同成长!💬

  💪 无论你在编程的道路上遇到什么困难,都希望你能坚持下去,因为每一次的挫折都是通往成功的必经之路。我们期待与你一起书写编程的精彩篇章! 🎉

  🌈 最后,再次感谢你的厚爱与支持!愿你在编程的道路上越走越远,收获满满的成就和喜悦!祝你编程愉快!🎉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/512292.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络-网络应用服务器

1.网络操作系统: 用统一的方法管理各主机之间的通信和资源的共享。主要功能:网络通信、共享资源、网络管理、网络服务、互操作、网络接口。四大特征:并发、资源共享、虚拟、异步性。安全性:用户账号、时间限制、地点限制、磁盘空间…

【详识JAVA语言】Java图形化界面-JOptionPane

简介 JOptionPane可以用来构造与用户交互的窗口。JOptionPane类由 import javax.swing.JApplet; 导入。JOptionPane类产生用于获取输入或显示输出的窗口。 语法 输入 使用showInputDialog()作为输入,但只能输入字符串值。要将输入值从字符串转换为整数&#xff0c…

EdgeX Foundry 安全模式安装部署

文章目录 一、安装准备1.官方文档2. 克隆服务器3.安装 Docker4.安装 docker-compose 二、安装部署1.docker-comepse2.启动 EdgeX Foundry3.访问 UI3.1. consul3.2. EdgeX Console EdgeX Foundry # EdgeX Foundryhttps://iothub.org.cn/docs/edgex/ https://iothub.org.cn/docs…

YOLOv9来了,YOLOv5和YOLOv8还香不香?

在目标检测领域,YOLO(You Only Look Once)一直是一种突破性算法。自YOLO算法问世以来,它已经演变为许多版本,其中最受欢迎的版本是YOLOv5和YOLOv8。这两个版本都有独特的特点和优势,使它们在各自的领域表现…

短视频账号矩阵系统开发3年----技术环境外部的动荡

前言: 目前市面上开发短视频账号矩阵系统的源头公司已经不多了吧,或者说都已经被市场被官方平台的政策影响的不做了吧,做了3年多的矩阵系统开发到现在真的是心里没有安全感吧,抖音的代发布接口,21年大封一次&#xff…

SpringCloud微服务-DockerCompose(初识、安装、部署)

DockerCompose(初识、安装、部署) 文章目录 DockerCompose(初识、安装、部署)初识DockerCompose?DockerCompose安装DockerCompose部署微服务问题解决(重要!!!&#xff09…

npm install没有创建node_modules文件夹

问题记录 live-server 使用时 报错:live-server : 无法将“live-server”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 npm install 安装 但是 这时npm install没有创建node_modules文件夹,只生成package-lock.json文件 方法一: 手…

HashData的湖仓一体思考:Iceberg、Hudi特性讲解与支持方案

湖仓一体作为一种新兴的开放式数据管理架构,能够充分发挥数据湖的灵活性、生态丰富以及数据仓库的企业级数据分析能力,已经成为企业建设现代数据平台的热门选择。 在此前的直播中,我们分享了HashData湖仓一体方案架构设计与Hive数据同步。本…

你所不知道的端口耗尽(三)

问题背景 在你所不知道的端口耗尽前面的两篇章节中,介绍了经典的客户端端口耗尽和SNAT端口耗尽问题,但是对于解决方案只是一笔带过,这篇文章会更详细的介绍解决方案。解决方案主要分为两大类,优化部署和优化应用程序。 优化部署 …

Unity2013.1.19_DOTS_Burst compiler

Unity2013.1.19_DOTS_Burst compiler DOTS是一种新产品,现在尚在起步阶段。由于它处于持续发展中,随着我们努力使其达到最佳状态,您将看到API会不断演变和日趋成熟。 DOTS包含以下元素: 实体组件系统(ECS) - 提供使用面向数据的…

selenuim【1】$x(‘xpath’)、WebDriverWait()、try/assert

文章目录 1、执行driver webdriver.Chrome()后很久才打开浏览器2、浏览器多元素定位 $x(‘xpath语法’)3、打开浏览器driver.get("网址")执行了很久才开始定位元素:等待(1)driver.set_page_load_timeout(t)(2&#xff…

亚信安慧AntDB:编织数据丝路,缔造创新篇章

亚信安慧AntDB作为一款具备国产化升级改造经验的数据库系统,在15年的平稳运行中积累了丰富经验。通过持续的创新和技术进步,AntDB不断优化性能和功能,满足用户的需求,与国际先进数据库系统保持竞争力。 AntDB秉承着与用户和行业保…