Pandas.Series.std() 样本标准差/总体标准差详解含代码含测试数据集随Pandas版本持续更新-编程知识

Pandas.Series.std() 样本标准差/总体标准差详解含代码含测试数据集随Pandas版本持续更新

关于Pandas版本： 本文基于 pandas2.1.2 编写。

关于本文内容更新： 随着pandas的stable版本更迭，本文持续更新，不断完善补充。

Pandas稳定版更新及变动内容整合专题： Pandas稳定版更新及变动迭持续更新。

Pandas API参考所有内容目录

本节目录

Pandas.Series.std()
- 计算公式：
- 语法：
- 返回值：
- 参数说明：
- - axis 指定计算方向（行或列）
  - skipna 忽略缺失值
  - ddof 自由度修正
  - numeric_only 排除非纯数值的行或列
- 相关方法：
- 示例：
- - 例1：如果是 `Series` 始终保持 `axis=0`，即计算整列的标准差。
  - 例2：如果整列都是缺失值，那么标准差计算结果也是缺失值。
  - 例3：控制自由度修正值，当 `ddof=0` 将计算 **总体标准差**。

Pandas.Series.std()

Pandas.Series.std 方法用于返回 Series 的标准差，通过控制自由度参数 ddof 可以实现返回 样本标准差 或 总体标准差 。

传送门：标准差的概念
⚠️ 关于取样方法的说明（不纠结计算过程的同学请跳过）：

Pandas.Series.std 方法的默认 ddof=1，对当前数据计算 样本标准差 ：
- 并不是在你当前数据中取样后，再进行标准差计算。
- 样本指的是，当前准备计算标准差的数据，是你全部的数据中取出的部分样本。
- 例如：你有一个数组[1, 2, 3, 4] ，使用Pandas.Series.std 计算标准差。无论是 ddof=1 或 ddof=0 ，参与计算的数值总量n或N，都是4个。
- 综上所述，强迫症同学不必纠结于样本标准差的 取样方法 ，因为根本就没取样。

计算公式：

样本标准差公式 Pandas.Series.std 默认的标准差计算方法是根号内以 n-1 为底，即样本标准差：

$\sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}}$

$s$ 表示样本标准差， $n$ 表示样本大小， $x_i$ 表示每个观测值， $\bar{x}$ 表示样本均值。
总体标准差公式

$\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}$

$\sigma$ 表示总体标准差， $\mu$ 表示总体均值， $N$ 表示总体大小。

语法：

Series.std(axis=None, skipna=True, ddof=1, numeric_only=False, **kwargs)

返回值：

Series or Series (if level specified)
- 返回 Series 或 Series ，依传输的数据结构而定。

参数说明：

axis 指定计算方向（行或列）

axis : {0 or ‘index’}

axis 参数，用于指定计算方向，即按行计算或按列计算标准差：
- 对于 Series 此参数无效，将始终保持 axis=0，即计算整列的标准差。^例1

skipna 忽略缺失值

skipna : bool, default False >

skipna 参数，用于指定求标准差的时候是否忽略缺失值：
- False： 不忽略，缺失值在求标准差的时候，会被解析为浮点数 float 0.0。
- True: 忽略缺失值。
⚠️ 注意 :

如果整列都是缺失值，那么标准差结果是依然是NaN。 ^例2

ddof 自由度修正

ddof : int, default 1 ^例3

ddof ： Delta 自由度，用于计算的除数是 N-ddof ，其中 N 代表元素的数量。默认值为 1。
- ddof=1 计算 样本标准差（默认）。
- ddof=0 计算 总体标准差。
  - 当 ddof=0 Series.std 的行为和 numpy.std 一致。
⚠️ddof 应该如何取值？：
- 如果你准备计算标准差的数据，是某个总体数据集的一部分样本，你想通过这一部分样本对总体数据集的标准差进行无偏估计，则可以选择使 ddof=1 或保持默认。进行 样本标准差 的计算。
- 如果你准备计算标准差的数据，就是你的总体数据集的全部，你可以选择使ddof=0 。进行 总体标准差 的计算。

numeric_only 排除非纯数值的行或列

numeric_only : bool, default False

numeric_only 参数，用于控制是否排除非纯数值的行或列：
- 对于 Series 此参数无效。

示例：

测试文件下载：

本文所涉及的测试文件，如有需要，可在文章顶部的绑定资源处下载。

若发现文件无法下载，应该是资源包有内容更新，正在审核，请稍后再试。或站内私信作者索要。

测试文件下载位置.png

测试文件下载位置

例1：如果是 `Series` 始终保持 `axis=0`，即计算整列的标准差。

import numpy as np
import pandas as pds = pd.Series([24.0, np.nan, 21.0, 33, 26], name="age")
s.std()

5.0990195135927845

例2：如果整列都是缺失值，那么标准差计算结果也是缺失值。

import numpy as np
import pandas as pds = pd.Series([np.NaN, np.NaN])s.std()

nan

例3：控制自由度修正值，当 `ddof=0` 将计算总体标准差。

观察计算样本标准差的结果

import numpy as np
import pandas as pds = pd.Series([21, 25, 62, 43])
s.std()

18.786076404259266

观察计算总体标准差的结果

import numpy as np
import pandas as pds = pd.Series([21, 25, 62, 43])
s.std(ddof=0)

16.269219403523945

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/421733.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Pandas.Series.std() 样本标准差/总体标准差详解含代码含测试数据集随Pandas版本持续更新

本节目录

Pandas.Series.std()

计算公式：

语法：

返回值：

参数说明：

axis 指定计算方向（行或列）

skipna 忽略缺失值

ddof 自由度修正

numeric_only 排除非纯数值的行或列

相关方法：

示例：

例1：如果是 `Series` 始终保持 `axis=0`，即计算整列的标准差。

例2：如果整列都是缺失值，那么标准差计算结果也是缺失值。

例3：控制自由度修正值，当 `ddof=0` 将计算总体标准差。

相关文章

Linux_清理docker磁盘占用

竞赛保研多目标跟踪算法实时检测 - opencv 深度学习机器视觉

java小项目：简单的收入明细记事本，超级简单（不涉及数据库，通过字符串来记录）

GitFlow工作流

一文了解SSL证书价格

GEE：最小距离分类器（minimumDistance）分类教程（样本制作、特征添加、训练、精度、最优参数、统计面积）

SMT贴片加工检测设备都有哪些

照片修复-GPEN框架

uni-app小程序：文件下载打开文件方法苹果安卓都适用

爬虫-selenium自动化(3)-验证码

旅游项目day12

手把手教你开发Python桌面应用-PyQt6图书管理系统-登录功能UI设计实现

Pandas.Series.std() 样本标准差/总体标准差 详解 含代码 含测试数据集 随Pandas版本持续更新

本节目录

Pandas.Series.std()

计算公式：

语法：

返回值：

参数说明：

axis 指定计算方向（ 行或列）

skipna 忽略缺失值

ddof 自由度修正

numeric_only 排除非纯数值的行或列

相关方法：

示例：

例1：如果是 Series 始终保持 axis=0，即计算整列的标准差。

例2：如果整列都是缺失值，那么标准差计算结果也是缺失值。

例3：控制自由度修正值，当 ddof=0 将计算 总体标准差。

相关文章

Pandas.Series.std() 样本标准差/总体标准差详解含代码含测试数据集随Pandas版本持续更新

axis 指定计算方向（行或列）

例1：如果是 `Series` 始终保持 `axis=0`，即计算整列的标准差。

例3：控制自由度修正值，当 `ddof=0` 将计算总体标准差。