Pandas.Series.std() 样本标准差/总体标准差 详解 含代码 含测试数据集 随Pandas版本持续更新

关于Pandas版本: 本文基于 pandas2.1.2 编写。

关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。

Pandas稳定版更新及变动内容整合专题: Pandas稳定版更新及变动迭持续更新。

Pandas API参考所有内容目录

本节目录

  • Pandas.Series.std()
    • 计算公式:
    • 语法:
    • 返回值:
    • 参数说明:
      • axis 指定计算方向( 行或列)
      • skipna 忽略缺失值
      • ddof 自由度修正
      • numeric_only 排除非纯数值的行或列
    • 相关方法:
    • 示例:
      • 例1:如果是 `Series` 始终保持 `axis=0`,即计算整列的标准差。
      • 例2:如果整列都是缺失值,那么标准差计算结果也是缺失值。
      • 例3:控制自由度修正值,当 `ddof=0` 将计算 **总体标准差**。

Pandas.Series.std()

Pandas.Series.std 方法用于返回 Series 的标准差,通过控制自由度参数 ddof 可以实现返回 样本标准差总体标准差

  • 传送门:标准差的概念

  • ⚠️ 关于取样方法的说明(不纠结计算过程的同学请跳过):

    Pandas.Series.std 方法的默认 ddof=1,对当前数据计算 样本标准差

    • 并不是在你当前数据中取样后,再进行标准差计算。
    • 样本 指的是,当前准备计算标准差的数据,是你全部的数据中取出的部分样本。
    • 例如:你有一个数组[1, 2, 3, 4] ,使用Pandas.Series.std 计算标准差。无论是 ddof=1ddof=0 ,参与计算的数值总量nN,都是4个。
    • 综上所述,强迫症同学不必纠结于样本标准差取样方法 ,因为根本就没取样。

计算公式:

  • 样本标准差公式 Pandas.Series.std 默认的标准差计算方法是根号内以 n-1 为底,即样本标准差:

    s = ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}} s=n1i=1n(xixˉ)2

    s s s 表示样本标准差, n n n 表示样本大小, x i x_i xi 表示每个观测值, x ˉ \bar{x} xˉ 表示样本均值。

  • 总体标准差公式

    σ = ∑ i = 1 N ( x i − μ ) 2 N \sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}} σ=Ni=1N(xiμ)2

    σ \sigma σ 表示总体标准差, μ \mu μ 表示总体均值, N N N 表示总体大小。

语法:

Series.std(axis=None, skipna=True, ddof=1, numeric_only=False, **kwargs)

返回值:

  • Series or Series (if level specified)

    • 返回 SeriesSeries ,依传输的数据结构而定。

参数说明:

axis 指定计算方向( 行或列)

  • axis : {0 or ‘index’}

    axis 参数,用于指定计算方向,即按行计算或按列计算标准差:

    • 对于 Series 此参数无效,将始终保持 axis=0,即计算整列的标准差。例1

skipna 忽略缺失值

  • skipna : bool, default False >

    skipna 参数,用于指定求标准差的时候是否忽略缺失值:

    • False: 不忽略,缺失值 在求标准差的时候,会被解析为浮点数 float 0.0
    • True: 忽略缺失值。

    ⚠️ 注意 :

    如果整列都是缺失值,那么标准差结果是依然是NaN。 例2

ddof 自由度修正

  • ddof : int, default 1 例3

    ddof : Delta 自由度,用于计算的除数是 N-ddof ,其中 N 代表元素的数量。默认值为 1。

    • ddof=1 计算 样本标准差(默认)
    • ddof=0 计算 总体标准差
      • ddof=0 Series.std 的行为和 numpy.std 一致。
  • ⚠️ddof 应该如何取值?:

    • 如果你准备计算标准差的数据,是某个总体数据集的一部分样本,你想通过这一部分样本对总体数据集的标准差进行无偏估计,则可以选择使 ddof=1 或保持默认。进行 样本标准差 的计算。
    • 如果你准备计算标准差的数据,就是你的总体数据集的全部,你可以选择使ddof=0 。进行 总体标准差 的计算。

numeric_only 排除非纯数值的行或列

  • numeric_only : bool, default False

    numeric_only 参数,用于控制是否 排除非纯数值的行或列:

    • 对于 Series 此参数无效。

相关方法:

➡️ 相关方法


  • DataFrame.std

    标准差(样本标准差/总体标准差)

示例:

测试文件下载:

本文所涉及的测试文件,如有需要,可在文章顶部的绑定资源处下载。

若发现文件无法下载,应该是资源包有内容更新,正在审核,请稍后再试。或站内私信作者索要。

测试文件下载位置.png

测试文件下载位置

例1:如果是 Series 始终保持 axis=0,即计算整列的标准差。

import numpy as np
import pandas as pds = pd.Series([24.0, np.nan, 21.0, 33, 26], name="age")
s.std()
5.0990195135927845

例2:如果整列都是缺失值,那么标准差计算结果也是缺失值。

import numpy as np
import pandas as pds = pd.Series([np.NaN, np.NaN])s.std()
nan

例3:控制自由度修正值,当 ddof=0 将计算 总体标准差

观察计算样本标准差的结果

import numpy as np
import pandas as pds = pd.Series([21, 25, 62, 43])
s.std()
18.786076404259266

观察计算总体标准差的结果

import numpy as np
import pandas as pds = pd.Series([21, 25, 62, 43])
s.std(ddof=0)
16.269219403523945

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/421733.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux_清理docker磁盘占用

文章目录 前言一、docker system 命令1. docker system df(本文重点使用)2. docker system prune(本文重点使用)3. docker system info4. docker system events 二、开始清理三、单独清理Build Cache四、单独清理未被使用的网络 前…

竞赛保研 多目标跟踪算法 实时检测 - opencv 深度学习 机器视觉

文章目录 0 前言2 先上成果3 多目标跟踪的两种方法3.1 方法13.2 方法2 4 Tracking By Detecting的跟踪过程4.1 存在的问题4.2 基于轨迹预测的跟踪方式 5 训练代码6 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习多目标跟踪 …

java小项目:简单的收入明细记事本,超级简单(不涉及数据库,通过字符串来记录)

一、效果 二、代码 2.1 Acount类 package com.demo1;public class Acount {public static void main(String[] args) {String details "收支\t账户金额\t收支金额\t说 明\n"; //通过字符串来记录收入明细int balance 10000;boolean loopFlag true;//控制循…

GitFlow工作流

基于 Git 这一版本控制系统,通过定义不同的分支,探索合适的工作流程来完成开发、测试、修改等方面的需求。 例如:在开发阶段,创建 feature 分支,完成需求后,将此分支合并到 develop 分支上;在发…

一文了解SSL证书价格

SSL证书的价格因供应商、证书类型和服务级别而异。以下是一些一般性的价格范围: 1. 免费证书:一些证书颁发机构(CA)提供免费的SSL证书,最著名的是JoySSL。这种证书通常适用于个人网站和小型业务。免费证书提供了基本的…

GEE:最小距离分类器(minimumDistance)分类教程(样本制作、特征添加、训练、精度、最优参数、统计面积)

作者:CSDN @ _养乐多_ 本文将介绍在Google Earth Engine (GEE)平台上进行最小距离分类(minimumDistance)的方法和代码,其中包括制作样本点教程(本地、在线和本地在线混合制作样本点,合并样本点等),加入特征变量(各种指数、纹理特征、时间序列特征、物候特征等),运行…

SMT贴片加工检测设备都有哪些

SMT贴片加工的工艺流程复杂繁琐,每个环节都需小心谨慎否则就会出现不良板,为确保产品质量合格,一般贴片加工厂都会使用各种检测设备对故障缺陷进行检测。那么在SMT贴片加工厂中最常见的检测设备都有哪些呢?它们的功能又是什么呢&a…

照片修复-GPEN框架

一 照片修复-GPEN介绍: gpen是一个优秀的照片修复框架,关键是开源的,它是基于GAN先验嵌入网络的野外盲脸复原,特别是针对人脸修复效果特别好,先看一下官方的效果图: 修复效果图前后对比: 二 安装GPEN 1 下…

uni-app小程序:文件下载打开文件方法苹果安卓都适用

api: const filetype e.substr(e.lastIndexOf(.)1)//获取文件地址的类型 console.log(文档,filetype) uni.downloadFile({url: e,//e是图片地址success(res) {console.log(res)if (res.statusCode 200) {console.log(下载成功,);var filePath encodeURI(res.tempFilePath);…

爬虫-selenium自动化(3)-验证码

#验证码分很多种,奇葩也无处不在:哪个是真茅台,红绿灯,摩托车......(我是个人都看不出来) (๑﹏๑) #本节内容为selenium自动化实现验证码通过-------字符验证码,点触验证码。 验证码介绍 字符验证码案例 点触验证码案例

手把手教你开发Python桌面应用-PyQt6图书管理系统-登录功能UI设计实现

锋哥原创的PyQt6图书管理系统视频教程: PyQt6图书管理系统视频教程 Python桌面开发 Python入门级项目实战 (无废话版) 火爆连载更新中~_哔哩哔哩_bilibiliPyQt6图书管理系统视频教程 Python桌面开发 Python入门级项目实战 (无废话版) 火爆连载更新中~共计18条视频&…