常见的概率分布

news/2024/9/3 18:10:58/文章来源:https://www.cnblogs.com/qypx/p/18290584

1.离散型分布

1.1 两点分布(伯努利分布/贝努利分布/0-1分布)

称随机变量 \(X\) 服从参数为 \(p\) 的伯努利分布,如果它分别以概率 \(p\)\(1-p\) 取 1 和 0 为值。​

\[P(X=k)=p^k(1-p)^{1-k}, \quad k=0,1\\ X\sim B(1,p)\\ E(X)=p\\ D(X)=p(1-p) \]

1.2 二项分布

n次独立的伯努利试验。如果事件发生的概率是 \(p\),n次独立重复试验中发生k次的概率是(有放回抽样)

\[P(X=k)=\mathrm C_n^k p^k(1-p)^{n-k},\quad k=0,1,...,n\\ X\sim B(n,p)\\ E(X)=np\\ D(X)=np(1-p) \]

\(n\) 件产品,其中 \(m\) 件次品 (\(m<n\)),从中不放回地任意抽取 \(k\) 件产品和有放回地任意抽取 \(k\) 件产品,在这两种抽取方法中每次抽出次品的概率相同,都为 \(\frac{m}{n}\),抽得次品数的期望值也相同,都为 \(k\frac{m}{n}\),但抽到的次品数的分布列不同,方差不同(超几何分布与二项分布)

关于为什么不放回抽样,每次抽到次品的概率都是 \(\frac{m}{n}\),因为不放回抽样,每次抽样,都是与前些次的抽样相关的。
第一次抽样,抽中次品的概率为 \(\frac{m}{n}\)
第二次抽样,抽中次品的概率为 \(\frac{m}{n}\times\frac{m-1}{n-1}+\frac{n-m}{n}\times\frac{m}{n-1}=\frac{m}{n}\)
第三次抽样,抽中次品的概率为
\(\frac{m}{n}\times\frac{m-1}{n-1}\times\frac{m-2}{n-2}+\frac{m}{n}\times\frac{n-m}{n-1}\times\frac{m-1}{n-2}+\frac{n-m}{n}\times\frac{m}{n-1}\times\frac{m-1}{n-2}+\frac{n-m}{n}\times\frac{n-m-1}{n-1}\times\frac{m}{n-2}\)
经过计算可得仍为 \(\frac{m}{n}\)

1.3 几何分布

在n次伯努利试验中,试验k次才第一次成功的概率。几何分布是帕斯卡分布当 \(r=1\) 时的特例

\[P(X=k)=(1-p)^{k-1}p,\quad k=1,2,...\\ X \sim GE(p)\\ E(X)=\frac{1}{p}\\ D(X)=\frac{1-p}{p^2} \]

例:某产品的合格率为0.05,则首次查到不合格品的检查次数 \(X\sim GE(0.05)\)

1.4 帕斯卡分布(负二项分布)

在重复独立的伯努利试验中,设每次试验成功的概率为 \(p\),若将试验进行到出现 \(r\) (\(r\) 为常数) 次成功为止,以随机变量 \(X\) 表示所需试验次数,

\[P(X=k)=\mathrm C_{k-1}^{r-1}p^r(1-p)^{k-r}, \quad k=r,r+1,...\\ E(X)=\frac{r}{p} \]

(当 \(r\) 是整数时,负二项分布又称帕斯卡分布)

1.5 超几何分布

从 N 个物件中抽出 n 个物件,成功抽出指定种类的物件的次数(不放回抽样)。

\(X\sim H(N,M,n)\)

产品抽样检查中,假定在 N 件产品中有 M 件不合格品,即不合格率为 \(\frac{M}{N}\),在产品中随机抽 n 件进行检查,发现 k 件不合格品的概率为

\[P(X=k)=\frac{\mathrm C_M^k \mathrm C_{N-M}^{n-k}}{\mathrm C_N^n},\quad k=0,1,...,min\{n,M\}\\ E(X)=\frac{nM}{N}\\ D(X)=n\frac{M}{N}(1-\frac{M}{N})\frac{N-m}{N-1} \]

1.6 泊松分布

泊松分布适用于描述单位时间内随机事件发生的次数,泊松分布的参数 \(\lambda\) 是单位时间内随机事件的平均发生次数。

\[P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}, \quad k=0,1,...\\ E(X)=\lambda\\ D(X)=\lambda \]

特征函数:\(\Psi(t)=\exp\{\lambda(e^{it}-1)\}\)

2.连续型分布

2.1 均匀分布 \(U(a,b)\)

密度函数:

\[f(x)=\left\{ \begin{aligned} &\frac{1}{b-a}&,&\quad a<x<b \\ &0&,&\quad 其他 \end{aligned} \right. \]

分布函数:

\[F(x)=\left\{ \begin{aligned} &0&,&\quad x<a \\ &\frac{x-a}{b-a}&,&\quad a\leq x < b\\ &1&,&\quad x\geq b \end{aligned} \right. \]

期望和方差:

\[E(X)=\frac{a+b}{2}\\ D(X)=\frac{(b-a)^2}{12} \]

2.2 指数分布 \(E(\lambda)\)

\[f(x)=\left\{ \begin{aligned} &\lambda e^{-\lambda x} &,&\quad x>0 \\ &0&,&\quad 其他 \end{aligned} \right. \]

\[F(x)=\left\{ \begin{aligned} &0&,&\quad x<0\\ &1-e^{-\lambda x} &,&\quad x\geq0 \\\end{aligned} \right. \]

\[E(X)=\frac 1\lambda\\ D(X)=\frac {1}{\lambda^2} \]

2.3 正态分布 \(N(\mu, \sigma^2)\)

\[f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty <x<+\infty\\ F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^x e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt\\ \]

\[E(X)=\mu\\ D(X)=\sigma^2 \]

一般来说,正态分布的密度曲线是以为中心,在 \(\mu\) 的两侧呈对称的形状,曲线的形状像一个钟的剖面,故称为钟形曲线。 \(\sigma\) 越大,密度曲线的峰度越低; \(\sigma\) 越小,密度曲线的峰度越高。无论参数 \(\mu\)\(\sigma\) 取何值,密度曲线下所覆盖的面积均于 1。 正态分布的密度曲线见图 1.4 。

image

正态分布曲线下,位于\(\mu\pm \sigma, \mu\pm 2\sigma, \mu\pm 3\sigma\) 之间的面积分别约占总面积的 68.26%,95.45%, 99.73%, 如 图 1.5 所示 。
image

当总体概率分布为正态分布时,作为从中抽出的样本,其统计量的样本概率分布有卡方分布,t分布,F分布等。因此正态分布成为计量经济学乃至统计学中最重要的概念之一。

2.4 \(\chi^2\)分布

如果从标准正态分布 \(N(0,1)\) 的总体中得到 n 个独立的随机变量分别为 \(X_1, X_2, ..., X_n\),则由 \(\sum_{i=1}^n X_i^2\) 得到的分布称作自由度为 n 的 \(\chi^2\) 分布,记为 \(X\sim \chi^2(n)\).

期望和方差:

\[E(X)=n\\ D(X)=2n \]

image

\(\chi^2\) 分布的加法定理. 设 \(X_1, X_2, ..., X_k\) 是相互独立的随机变量,且 \(X_i\sim \chi^2(n_i), i=1,2,...,k\),则

\[\sum_{i=1}^k X_i \sim \chi^2(n_1+n_2+...+n_k). \]

\(\chi^2\)分布与 \(N(0,1)\) 分布之间有如下关系:

\(X_1, X_2, ..., X_n\) 是相互独立的随机变量,并且 \(X_i\sim N(0,1), i=1,2,...,n\),则

\[\sum_{i=1}^n X_i^2\sim \chi^2(n). \]

2.5 t分布

设随机变量 \(X\sim N(0,1), Y\sim \chi^2(n)\),X 与 Y 相互独立,则随机变量

\[t=\frac{X}{\sqrt{Y/n}} \]

遵从自由度为n的t分布,记为 \(t=\frac{X}{\sqrt{Y/n}}\sim t(n)\).

期望和方差:

当n>2时,\(E(t)=0, D(t)=\frac{n}{n-2}\).

image

当n<30时,t分布的分散程度比标准正态分布大,密度函数曲线比较平缓,随着n的增大,t分布逐渐接近标准正态分布;当 \(n\rightarrow\infty\)时,t分布渐进标准正态分布

t分布可用于方差未知时对有关均值的假设进行检验。关于回归系数的显著性检验就用到 t分布。

2.6 F分布

设随机变量 \(X\sim \chi^2(n_1), Y\sim \chi^2(n_2)\),且X与Y相互独立,则称随机变量

\[F=\frac{X/n_1}{Y/n_2} \]

遵从自由度为 \((n_1,n_2)\) 的F分布,记作 \(F\sim F(n_1,n2)\).

F分布的形状为正偏态分布,随着 \(n_1,n_2\) 的增大,其概率密度曲线的偏斜度虽有所减缓却仍保持偏态分布,并不以正态分布为其极限分布形式。

image

如果 \(t\sim t(n)\),则 \(t^2\sim F(1,n)\)
如果 \(F\sim F(n_1,n_2)\),则 \(\frac1F \sim F(n_2, n_1)\).

F分布在回归方程的显著性检验中具有重要作用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/740730.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python使用flask框架生成excle返回前端(包含图片、表格、表头灰色、表格加边框)

python使用flask框架生成excle文档,文档中包含图片和表格,其中表格要包含图片、表格、表头灰色、表格加边框,照片和表格不重叠。 逻辑:获得图片的高度,根据高度计算表格从第几行开始插入。 效果图:代码:import openpyxl from openpyxl.styles import PatternFill from o…

生成扩散模型漫谈(二):DDPM = 自回归式VAE

在文章《生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼》中,我们为生成扩散模型DDPM构建了“拆楼-建楼”的通俗类比,并且借助该类比完整地推导了生成扩散模型DDPM的理论形式。在该文章中,我们还指出DDPM本质上已经不是传统的扩散模型了,它更多的是一个变分自编码器VAE,实际…

生成扩散模型漫谈(三):DDPM = 贝叶斯 + 去噪

到目前为止,笔者给出了生成扩散模型DDPM的两种推导,分别是《生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼》中的通俗类比方案和《生成扩散模型漫谈(二):DDPM = 自回归式VAE》中的变分自编码器方案。两种方案可谓各有特点,前者更为直白易懂,但无法做更多的理论延伸和定量…

ComfyUI进阶篇:ComfyUI核心节点(四)

ComfyUI核心节点(四) 前言: 学习ComfyUI是一场持久战。当你掌握了ComfyUI的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对ComfyUI的核心节点进行系统梳理,并详细解释…

全网最全EdgeMesh QA手册

https://zhuanlan.zhihu.com/p/585749690全网最全EdgeMesh Q&A手册Poorunga今天摸大鱼 24 人赞同了该文章​目录收起转载请注明出处前言定位模型问题一:Failed to watch xxx: failed to list xxx: no kind xxx ; Reflector ListAndWatch xxx (total time 10003ms)问题二:…

.NetCore中EFCore for MySql整理MySql.EntityFrameworkCore

一、MySql.EntityFrameworkCore 这个是官方给的一个EF操作MySql数据库的框架。 使用方法跟EF for SqlServer 一样。二、安装命令NuGet\Install-Package MySql.EntityFrameworkCore -Version 8.0.5 项目依赖 安装后的结果: 三、 EF Code First 模式连接数据库更多: C#程序调…

Caterpillar on a Tree

首先一个很显然的地方就是使用传送门肯定是在叶子节点使用,我们来考虑一下整个过程是怎么样的 为了方便,我们不妨假设可以传送回根节点\(k+1\)次,然后要求最后回到根节点 我们先从根节点走到某一个叶子结点,然后再从这个叶子节点走到另一个叶子节点,然后继续走到另一个叶子…

Linux-网络安全私房菜

前言本文章仅仅是我个人学习过程中,觉得会在安全领域用的比较多的命令,也有一些本散修在Linux入门学习中的一些命令与总结心得。道友们可参考一二我的修炼心得,切勿无脑修炼,适合自己的才是最好。目录前言入门基本指令篇章man帮助手册字符集设置cdlsdatemkdirtouch-d-m修改…

Linux应急响应——知攻善防应急靶场-Linux(1)

Linux应急响应靶机 1前景需要:小王急匆匆地找到小张,小王说"李哥,我dev服务器被黑了",快救救我!!挑战内容:黑客的IP地址遗留下的三个flag目录查看history历史指令查看开机自启动项异常连接和端口异常进程定时任务异常服务日志分析账户排查总结 靶场出处是知攻善…

RockyLinux9.4升级Linux内核6.X️

RockyLinux9.4升级Linux内核6.X🌶️ 原文连接:https://rockylinux.cn/notes/rocky-linux-9-nei-he-sheng-ji-zhi-6.html 查看当前内核版本[root@localhost ~]# uname -aLinux iZ2zeaytpwetf58zk3e21dZ 5.14.0-427.18.1.el9_4.x86_64 #1 SMP PREEMPT_DYNAMIC Mon May 27 16:…

网络安全--计算机网络安全概述

那么问题就来了,如果我的访问控制权限被高级别的权限回收了,那么我不作限制那么对方依旧会拥有我分配给他的权限,这就是为什么在数据库中会有级联删除,级联权限,需要工作人员做分配设置。保证用户的信息完整性,就是不允许非信息拥有者篡改其他人的信息,因为拥有者所拥有…

SQL注入方法

记录一些注入思路和经常使用的工具,后续有用到新的工具和总结新的方法再继续补充。目录前言如何测试与利用注入点手工注入思路工具sqlmap-r-u-m--level--risk-v-p--threads-batch-smart--os-shell--mobiletamper插件获取数据的相关参数 前言记录一些注入思路和经常使用的工具,…