python统计分析——样本方差的分布

参考资料:用python动手学统计学

1、导入库

import numpy as np
import pandas as pd
import scipy as sp
from scipy import statsfrom matplotlib import pyplot as plt
import seaborn as sns

2、数据准备

      建立一个平均数为4,标准差为0.8的正态分布总体

# stats.norm()表示正态分布,其中loc参数表示均值,scale参数表示标准差
pop=stats.norm(loc=4,scale=0.8) 

3、程序模拟:执行1万次“从总体中抽取10个数据作为一个样本并求其方差”

# 建立一个数组用于存放样本方差
sample_var_array=np.zeros(10000)
# 设置随机种子,用于复现结果
np.random.seed(1)
# 获取1万个样本方差
for i in range(0,10000):sample=pop.rvs(size=10)sample_var_array[i]=np.var(sample,ddof=0)
np.mean(sample_var_array)

      np.var()的相关解释可参考:python统计分析——单变量描述统计-CSDN博客

注意此处在求方差时的参数ddof=0的设置。

      1万个样本方差的平均数计算结果为:0.5746886877332101,与总体方差0.64,相差较大。可见这个数过小地估计了总体方差。

4、采取无偏方差消除偏离

      还是上一段代码,但此时np.var()的参数中,ddof设置为1,计算结果为样本的无偏方差。

# 建立一个数组用于存放样本方差
sample_var_array=np.zeros(10000)
# 设置随机种子,用于复现结果
np.random.seed(1)
# 获取1万个样本方差
for i in range(0,10000):sample=pop.rvs(size=10)sample_var_array[i]=np.var(sample,ddof=1)
np.mean(sample_var_array)

      1万个样本的无偏方差的平均数计算结果为:0.6385429863702334,与总体方差0.64十分接近。

5、样本容量越大,其无偏方差越接近总体方差

      下面用程序拟合不同样本容量下样本的无偏方差变化情况。

5.1 生成不同样本容量下的无偏方差数组

# 创建数组存放样本容量,从10变化至100010
size_array=np.arange(start=10,stop=100100,step=100)
# 创建数组用于存放样本方差
unbias_var_array_size=np.zeros(len(size_array))
# 设置随机种子,用于复现运行结果
np.random.seed(1)
# 利用循环,生成对应样本容量的样本无偏方差
for i in range(0,len(size_array)):sample=pop.rvs(size=size_array[i])unbias_var_array_size[i]=np.var(sample,ddof=1)

5.2 绘制无偏方差随样本容量变化的曲线

plt.plot(size_array,unbias_var_array_size)
plt.xlabel('sample size')
plt.ylabel('unbias var')

      由上图,可以看出,随着样本容量的不断变大,其无偏方差月接近总体方差(0.64)

有兴趣的同学,可以将ddof设置为0,查看下运行结果。t提示:随着样本容量的不断变大,样本容量n与n-1将无限接近,样本方差和无偏方差趋于相等。

名词解释

无偏性:估计量的期望值相当于真正的参数的特性叫作无偏性。说估计量具有无偏性,就是说它没有偏差,它的均值不会过大也不会太小。

一致性:样本容量越大,估计量越接近真正的参数的特性称为一致性。说估计值具有一致性,就是说当样本容量趋向于无穷大时,估计量趋近于参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/439202.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ctfshow web72

下载源码: 开启环境: 本题设置了 open_basedir(),将php所能打开的文件限制在指定的目录树中,包括文件本身。 因为 ini_set() 也被限制了,所以 open_basedir() 不能用 ini_set() 重新设置绕过。 使用 php 伪协议 glob:…

前端框架---Vue2学习教程(上)

从HTML到现在一路跟过来的小伙伴们,坚持固然不容易,但我相信大家已经学到了不少,那么我们开始马不停蹄的进入前端的框架吧,下面讲的是Vue2,大家继续加油鸭!!!! Vue2 Vu…

Springboot使用数据库连接池druid

springboot框架中可以使用druid进行数据库连接池,下面介绍druid在springboot中使用和参数配置介绍。 数据库连接池(Druid)是一种用于管理数据库连接的机制,其工作原理和常见使用方法如下: 原理:数据库连接…

awk命令使用方法

简介 awk 是一种强大的文本处理工具,可以用于处理结构化的文本数据。它可以根据指定的模式和动作来筛选、处理和格式化文本。 下面是一些常见的 awk 命令使用方法。 详细介绍 基本语法: awk pattern { action } filename其中,pattern 是用…

短视频界的变革者:上海 AI lab 发布 Vlogger,几句话生成分钟级视频

现如今,vlog 已经成为我们日常生活的重要组成部分。无论是看视频学习休闲、记录珍贵瞬间还是分享生活见闻,视频已经成为人们表达创意和观点的独特媒介。 然而,与几秒钟的短视频不同,要创作出引人入胜、生动有趣的长视频&#xff…

微信积分系统怎么做_开启用户忠诚度之门

积分系统:开启用户忠诚度之门 在数字化时代,积分系统已经成为了企业与消费者之间互动的桥梁。它不仅是一种奖励机制,更是提升用户忠诚度、促进消费的重要手段。本文将深入探讨如何将积分系统作为主题,撰写一篇高质量的营销软文&a…

数据结构--顺序表的基本操作[王道]

截图来自王道数据结构公开课 目录 1.插入操作 代码 时间复杂度分析 2.删除操作 代码 时间复杂度分析 3.按值寻找(顺序查找) 代码 时间复杂度 4.按位寻找(按序号查找) 代码 快速回顾顺序表的定义以及特点:数据结构-顺序表的实现 [王道]-CSDN博客 本篇博…

二、防御保护---防火墙基础知识篇

二、防御保护---防火墙基础知识篇 一、什么是防火墙二、防火墙的发展史1.包过滤防火墙(一个严格的规则表)2.应用代理防火墙(每个应用添加代理)3.状态检测防火墙(首次检查建立会话表)3.入侵检测系统(IDS)-----网络摄像头4.入侵防御系统(IPS)-----抵御2-7层已知威胁5.防病毒网关(…

Unity中使用Ultraleap的InteractionButton组件

本节在上一节基础上进行,上一小结参考如下: Unity中创建Ultraleap 3Di交互项目 本节工程文件如下: Unity中使用Ultraleap的InteractionButton组件 本节结构有所更改,主要是参考官方示例结构进行重新调整,和上一小节相…

wordpress找不回密码怎么办?4种方法设置新密码

有些WordPress站长太久不登录后台了,所以就忘记了管理员登录密码,这种情况我们应该怎么找回密码呢?或者设置一个新密码呢?下面boke112百科就跟大家分享4种方法设置WordPress新密码。 方法一、登录页面的“忘记密码?”…

Shell中正则表达式

1.正则表达式介绍 1、正则表达式---通常用于判断语句中,用来检查某一字符串是否满足某一格式 2、正则表达式是由普通字符与元字符组成 3、普通字符包括大小写字母、数字、标点符号及一些其他符号 4、元字符是指在正则表达式中具有特殊意义的专用字符&#xff0c…

Hack The Box-Pov

信息收集&端口利用 先使用nmap对主机进行端口扫描 nmap 10.10.11.251只开放了80端口 访问网站后发现没有什么功能点,尝试目录扫描 并没有什么能够利用的点 使用gobuster进行子域名扫描 gobuster dns -d pov.htb -w /usr/share/wordlists/seclists/Discovery/DNS/subdo…