807补充(十一)(鞍论与随机逼近理论篇)

807补充(十一)(鞍论与随机逼近理论篇)

一.高等概率论初步

Theorem: σ − \sigma- σ 代数,如果样本空间 Ω \Omega Ω 的一系列子集的集合 F \mathcal{F} F 满足:

(1) ∅ ∈ F \emptyset \in \mathcal{F} F

(2) 若 A ∈ F A \in \mathcal{F} AF, 则 A c ∈ F A^c \in \mathcal{F} AcF

(3) 若 A 1 , A 2 … ∈ F A_1, A_2 \ldots \in \mathcal{F} A1,A2F, 则 ⋃ i = 1 ∞ A i ∈ F \bigcup_{i=1}^{\infty} A_i \in \mathcal{F} i=1AiF

我们称 F \mathcal{F} F 为一个 σ − \sigma- σ 代数, 或者 σ − \sigma- σ 域。

概率三元组是建立严格概率论的基础,它也被称为概率空间或概率测度空间。概率三元组由三个元素组成。

  • Ω : \Omega: Ω:称为样本空间(或结果空间)的集合。其中的任何元素(或点) Ω \Omega Ω, 表示为 ω \omega ω,称为结果。该集合包含随机抽样过程的所有可能结果。

  • F : \mathcal{F}: F:事件空间的集合。它是 Ω \Omega Ω σ − \sigma- σ代数(或 σ − \sigma- σ域), F \cal F F中的一个元素,表示为 A A A,称为事件。基本事件是指样本空间中的单个结果。一个事件可以是基本事件或多个基本事件的组合。

  • P : \Bbb P: P: F \mathcal F F [ 0 , 1 ] [0,1] [0,1]的映射。是一个概率测度,任何 A ∈ F A\in \mathcal F AF都是一个集合,其中包含一些属于 Ω \Omega Ω的点。 P ( A ) \Bbb P(A) P(A)就是这个集合的测度。

P ( A ) = 0 \Bbb P(A)=0 P(A)=0等价于 A A A是一个零测集,空集是零测集但零测集不是空集

随机变量:在概率三元组的基础上,我们将随机变量定义为从样本空间到实数的映射 X ( ω ) X(\omega) X(ω): Ω ⇒ R \Omega \Rightarrow \Bbb R ΩR,当然,并不是所有的映射都可以被定义为随机变量,随机变量的完整形式定义如下:

A function X : Ω → R X: \Omega \rightarrow \mathbb{R} X:ΩR is a random variable if
A = { ω ∈ Ω ∣ X ( ω ) ≤ x } ∈ F ∀ x ∈ R A=\{\omega \in \Omega \mid X(\omega) \leq x\} \in \mathcal{F} \qquad \forall x\in \Bbb R A={ωΩX(ω)x}FxR
这个定义表明,只有当 X ( ω ) ≤ x X(\omega)\leq x X(ω)x F \cal F F中的一个事件时, X X X才是随机变量

二.随机变量的条件期望

条件期望经常出现在随机序列的收敛性分析中,先考虑三种情况

  • E X [ X ∣ Y = 5 ] \Bbb E_{X}[X\mid Y=5] EX[XY=5]
  • E X [ X ∣ Y = y ] \Bbb E_{X}[X\mid Y=y] EX[XY=y]
  • E X [ X ∣ Y ] \Bbb E_{X}[X\mid Y] EX[XY]

不难看出,第一种情况是一个与 X , Y X,Y X,Y都无关的常数,第二种情况是与 Y = y Y=y Y=y有关的函数,而第三种情况由随机变量的定义可知为关于 Y Y Y的随机变量。条件期望也可写成 E X ∼ P ( X ∣ Y ) [ X ] \Bbb E_{X\sim P(X\mid Y)}[X] EXP(XY)[X],表示为当 X ∼ P ( X ∣ Y ) X\sim P(X\mid Y) XP(XY) X X X的期望。条件期望有以下常用性质

Theorem: Let X , Y , Z X, Y, Z X,Y,Z be random variables. The following properties hold.

(a) E X [ X = a ∣ Y ] = a \mathbb{E}_{X}[X=a \mid Y]=a EX[X=aY]=a, where a a a is a given number.

(b) E X , Z [ a X + b Z ∣ Y ] = a E X , Z [ X ∣ Y ] + b E X , Z [ Z ∣ Y ] \mathbb{E}_{X,Z}[a X+b Z \mid Y]=a \mathbb{E}_{X,Z}[X \mid Y]+b \mathbb{E}_{X,Z}[Z \mid Y] EX,Z[aX+bZY]=aEX,Z[XY]+bEX,Z[ZY].

© E X [ X ∣ Y ] = E X [ X ] \mathbb{E}_{X}[X \mid Y]=\mathbb{E}_{X}[X] EX[XY]=EX[X] if X , Y X, Y X,Y are independent.

(d) E X [ X f ( Y ) ∣ Y ] = f ( Y ) E X [ X ∣ Y ] \mathbb{E}_{X}[X f(Y) \mid Y]=f(Y) \mathbb{E}_{X}[X \mid Y] EX[Xf(Y)Y]=f(Y)EX[XY].

(e) E Y [ f ( Y ) ∣ Y ] = f ( Y ) \mathbb{E}_{Y}[f(Y) \mid Y]=f(Y) EY[f(Y)Y]=f(Y).

(f) E X [ X ∣ Y , f ( Y ) ] = E X [ X ∣ Y ] \mathbb{E}_{X}[X \mid Y, f(Y)]=\mathbb{E}_{X}[X \mid Y] EX[XY,f(Y)]=EX[XY].

(g) If X ≥ 0 X \geq 0 X0, then E X [ X ∣ Y ] ≥ 0 \mathbb{E}_{X}[X \mid Y] \geq 0 EX[XY]0.

(h) If X ≥ Z X \geq Z XZ, then E X [ X ∣ Y ] ≥ E X [ Z ∣ Y ] \mathbb{E}_{X}[X \mid Y] \geq \mathbb{E}_{X}[Z \mid Y] EX[XY]EX[ZY].

Proof.我们在这里仅证明其中一些性质,其他的可以用同样的方法证明

  • (a)对于任何 y y y E X [ X = a ∣ Y = y ] \Bbb E_{X}[X=a\mid Y=y] EX[X=aY=y]的取值都是个常数 a a a,所以得证
  • (b) E X , Z [ a X + b Z ∣ Y ] = ∑ X , Z [ a X + b Z ] ⋅ P ( X , Z ∣ Y ) = ∑ X , Z a ⋅ X ⋅ P ( X , Z ∣ Y ) + ∑ X , Z b ⋅ Z ⋅ P ( X , Z ∣ Y ) = a E X , Z [ X ∣ Y ] + b E X , Z [ Z ∣ Y ] \Bbb E_{X,Z}[aX+bZ\mid Y]=\sum_{X,Z}[aX+bZ]\cdot P(X,Z\mid Y)=\sum_{X,Z}a\cdot X\cdot P(X,Z\mid Y)+\sum_{X,Z}b\cdot Z\cdot P(X,Z\mid Y)=a \mathbb{E}_{X,Z}[X \mid Y]+b \mathbb{E}_{X,Z}[Z \mid Y] EX,Z[aX+bZY]=X,Z[aX+bZ]P(X,ZY)=X,ZaXP(X,ZY)+X,ZbZP(X,ZY)=aEX,Z[XY]+bEX,Z[ZY]
  • ©因 X , Y X,Y X,Y独立,则 P ( X ∣ Y ) = P ( X ) P(X\mid Y)=P(X) P(XY)=P(X)
  • (d) E X [ X f ( Y ) ∣ Y ] = ∑ X X f ( Y ) P ( X ∣ Y ) = f ( Y ) ∑ X X P ( X ∣ Y ) = \mathbb{E}_{X}[X f(Y) \mid Y]=\sum_X X f(Y) P(X \mid Y)=f(Y) \sum_X X P(X \mid Y)= EX[Xf(Y)Y]=XXf(Y)P(XY)=f(Y)XXP(XY)= f ( y ) E [ X ∣ Y = y ] = f ( Y ) E X [ X ∣ Y ] f(y) \mathbb{E}[X \mid Y=y]=f(Y) \mathbb{E}_{X}[X \mid Y] f(y)E[XY=y]=f(Y)EX[XY]
  • (e) E Y [ f ( Y ) = f ( y ) ∣ Y = y ] = f ( y ) \Bbb E_{Y}[f(Y)=f(y)\mid Y=y]=f(y) EY[f(Y)=f(y)Y=y]=f(y),所以得证
  • (g)因 X ≥ 0 , P ( X ∣ Y ) ≥ 0 X\geq0,P(X\mid Y)\geq0 X0,P(XY)0,得证
  • (h)利用(g)可证

三.重期望

Theorem: Let X , Y , Z X, Y, Z X,Y,Z be random variables. The following properties hold.

(a) E Y [ E X [ X ∣ Y ] ] = E X [ X ] \mathbb{E}_{Y}[\mathbb{E}_{X}[X \mid Y]]=\mathbb{E}_{X}[X] EY[EX[XY]]=EX[X].

(b) E Y , Z [ E X [ X ∣ Y , Z ] ] = E X [ X ] \mathbb{E}_{Y,Z}[\mathbb{E}_{X}[X \mid Y, Z]]=\mathbb{E}_{X}[X] EY,Z[EX[XY,Z]]=EX[X].

© E Y [ E X [ X ∣ Y ] ∣ Y ] = E X [ X ∣ Y ] \mathbb{E}_{Y}[\mathbb{E}_{X}[X \mid Y] \mid Y]=\mathbb{E}_{X}[X \mid Y] EY[EX[XY]Y]=EX[XY].

proof

  • (a)考虑 E X [ X ∣ Y ] \Bbb E_{X}[X|Y] EX[XY] Y Y Y的函数,定义为 f ( Y ) f(Y) f(Y)= E X [ X ∣ Y ] \Bbb E_{X}[X|Y] EX[XY]

E Y [ E X [ X ∣ Y ] ] = E Y [ f ( Y ) ] = ∑ y f ( Y = y ) P ( y ) = ∑ y E [ X ∣ Y = y ] P ( y ) = ∑ y ( ∑ x x P ( x ∣ y ) ) P ( y ) = ∑ x x ∑ y P ( x ∣ y ) P ( y ) = ∑ x x ∑ y P ( x , y ) = ∑ x x P ( x ) = E X [ X ] . \begin{aligned} \mathbb{E}_{Y}[\mathbb{E}_{X}[X \mid Y]]=\mathbb{E}_{Y}[f(Y)] & =\sum_y f(Y=y) P(y) \\ & =\sum_y \mathbb{E}[X \mid Y=y] P(y) \\ & =\sum_y\left(\sum_x x P(x \mid y)\right) P(y) \\ & =\sum_x x \sum_y P(x \mid y) P(y) \\ & =\sum_x x \sum_y P(x, y) \\ & =\sum_x x P(x) \\ & =\mathbb{E}_{X}[X] . \end{aligned} EY[EX[XY]]=EY[f(Y)]=yf(Y=y)P(y)=yE[XY=y]P(y)=y(xxP(xy))P(y)=xxyP(xy)P(y)=xxyP(x,y)=xxP(x)=EX[X].

  • (b)将 Y , Z Y,Z Y,Z记作 Q Q Q利用(a)可证
  • 利用条件期望公式(e)可证

四.随机序列收敛定义

我们在测度论的基础上建立概率论的一个主要原因是它能够严格地描述随机序列的收敛性。

考虑随机序列 { X k } = { X 1 , X 2 , … , X k , … } \left\{X_k\right\} =\left\{X_1, X_2, \ldots, X_k, \ldots\right\} {Xk}={X1,X2,,Xk,}这个序列中的每个元素都是定义在三元组上的随机变量 ( Ω , F , P ) (\Omega, \mathcal{F}, \mathbb{P}) (Ω,F,P)

  • Sure convergence:(点收敛)

​ Definition: { X k } \left\{X_k\right\} {Xk} converges surely (or everywhere or pointwise) to X X X if
lim ⁡ k → ∞ X k ( ω ) = X ( ω ) , for all  ω ∈ Ω \lim _{k \rightarrow \infty} X_k(\omega)=X(\omega), \quad \text { for all } \omega \in \Omega klimXk(ω)=X(ω), for all ωΩ

​ It means that lim ⁡ k → ∞ X k ( ω ) = X ( ω ) \lim _{k \rightarrow \infty} X_k(\omega)=X(\omega) limkXk(ω)=X(ω) is valid for all points in Ω \Omega Ω. This definition can be equivalently stated as
A = Ω where  A = { ω ∈ Ω : lim ⁡ k → ∞ X k ( ω ) = X ( ω ) } A=\Omega \quad \text { where } \quad A=\left\{\omega \in \Omega: \lim _{k \rightarrow \infty} X_k(\omega)=X(\omega)\right\} A=Ω where A={ωΩ:klimXk(ω)=X(ω)}

  • Almost sure convergence:(几乎必然收敛)
    Definition: { X k } \left\{X_k\right\} {Xk} converges almost surely (or almost everywhere or with probability 1 or w.p.1) to X X X if
    P ( A ) = 1 where  A = { ω ∈ Ω : lim ⁡ k → ∞ X k ( ω ) = X ( ω ) } . \mathbb{P}(A)=1 \quad \text { where } \quad A=\left\{\omega \in \Omega: \lim _{k \rightarrow \infty} X_k(\omega)=X(\omega)\right\} . P(A)=1 where A={ωΩ:klimXk(ω)=X(ω)}.

    It means that lim ⁡ k → ∞ X k ( ω ) = X ( ω ) \lim _{k \rightarrow \infty} X_k(\omega)=X(\omega) limkXk(ω)=X(ω) is valid for almost all points in Ω \Omega Ω. The points, for which this limit is invalid, form a set of zero measure. For the sake of simplicity,which is often written as
    P ( lim ⁡ k → ∞ X k = X ) = 1 \mathbb{P}\left(\lim _{k \rightarrow \infty} X_k=X\right)=1 P(klimXk=X)=1

    Almost sure convergence can be denoted as X k → a.s.  X X_k \xrightarrow{\text { a.s. }} X Xk a.s.  X.

  • Convergence in probability:(依概率收敛)
    Definition: { X k } \left\{X_k\right\} {Xk} converges in probability to X X X if for any ϵ > 0 \epsilon>0 ϵ>0,
    lim ⁡ k → ∞ P ( A k ) = 0 where  A k = { ω ∈ Ω : ∣ X k ( ω ) − X ( ω ) ∣ > ϵ } . \lim _{k \rightarrow \infty} \mathbb{P}\left(A_k\right)=0 \quad \text { where } \quad A_k=\left\{\omega \in \Omega:\left|X_k(\omega)-X(\omega)\right|>\epsilon\right\} . klimP(Ak)=0 where Ak={ωΩ:Xk(ω)X(ω)>ϵ}.

    For simplicity,the equation can be written as
    lim ⁡ k → ∞ P ( ∣ X k − X ∣ > ϵ ) = 0 \lim _{k \rightarrow \infty} \mathbb{P}\left(\left|X_k-X\right|>\epsilon\right)=0 klimP(XkX>ϵ)=0

  • Convergence in mean:( L p L^{p} Lp收敛)
    Definition: { X k } \left\{X_k\right\} {Xk} converges in the r r r-th mean (or in the L r L^r Lr norm) to X X X if
    lim ⁡ k → ∞ E [ ∣ X k − X ∣ r ] = 0 \lim _{k \rightarrow \infty} \mathbb{E}\left[\left|X_k-X\right|^r\right]=0 klimE[XkXr]=0

    The most frequently used cases are r = 1 r=1 r=1 and r = 2 r=2 r=2. It is worth mentioning that convergence in mean is not equivalent to lim ⁡ k → ∞ E [ X k − X ] = 0 \lim _{k \rightarrow \infty} \mathbb{E}\left[X_k-X\right]=0 limkE[XkX]=0 or lim ⁡ k → ∞ E [ X k ] = \lim _{k \rightarrow \infty} \mathbb{E}\left[X_k\right]= limkE[Xk]= E [ X ] \mathbb{E}[X] E[X], which indicates that E [ X k ] \mathbb{E}\left[X_k\right] E[Xk] converges but the variance may not.

  • Convergence in distribution:(依分布收敛)
    Definition: The cumulative distribution function of X k X_k Xk is defined as P ( X k ≤ a ) \mathbb{P}\left(X_k \leq a\right) P(Xka) where a ∈ R a \in \mathbb{R} aR. Then, { X k } \left\{X_k\right\} {Xk} converges to X X X in distribution if the cumulative distribution function converges:
    lim ⁡ k → ∞ P ( X k ≤ a ) = P ( X ≤ a ) , for all  a ∈ R . \lim _{k \rightarrow \infty} \mathbb{P}\left(X_k \leq a\right)=\mathbb{P}(X \leq a), \quad \text { for all } a \in \mathbb{R} . klimP(Xka)=P(Xa), for all aR.

    A compact expression is
    lim ⁡ k → ∞ P ( A k ) = P ( A ) \lim _{k \rightarrow \infty} \mathbb{P}\left(A_k\right)=\mathbb{P}(A) klimP(Ak)=P(A)
    where
    A k ≐ { ω ∈ Ω : X k ( ω ) ≤ a } , A ≐ { ω ∈ Ω : X ( ω ) ≤ a } . A_k \doteq\left\{\omega \in \Omega: X_k(\omega) \leq a\right\}, \quad A \doteq\{\omega \in \Omega: X(\omega) \leq a\} . Ak{ωΩ:Xk(ω)a},A{ωΩ:X(ω)a}.

点收敛要求在 Ω \Omega Ω上所有的点都收敛至 X ( ω ) X(\omega) X(ω),几乎必然收敛允许 Ω \Omega Ω上有部分点不收敛,但这部分集合必需是零测集。依概率收敛是比几乎必然收敛更宽松的条件,仅对随机变量的值进行要求,并未对自变量 ω \omega ω进行要求。依分布收敛进要求累积分布函数一致,并未做更多的要求。

.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/541095.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AVCE - AV Evasion Craft Online 更新 8 种加载方式 - 过 WD 等

免责声明:本工具仅供安全研究和教学目的使用,用户须自行承担因使用该工具而引起的一切法律及相关责任。作者概不对任何法律责任承担责任,且保留随时中止、修改或终止本工具的权利。使用者应当遵循当地法律法规,并理解并同意本声明…

LeetCode 热题 100 | 回溯(二)

目录 1 39. 组合总和 2 22. 括号生成 3 79. 单词搜索 菜鸟做题,语言是 C,感冒快好版 关于对回溯算法的理解请参照我的上一篇博客; 在之后的博客中,我将只分析回溯算法中的 for 循环。 1 39. 组合总和 题眼:c…

网站被挂马劫持的解决办法

首先,应该检查网站的DNS记录,以确定是否有人修改了DNS记录。如果发现有人修改了DNS记录,应该立即更改DNS记录,以恢复网站的正常访问。此外,应该检查网站的源代码,以确定是否有人植入了恶意代码。如果发现有…

【Web】浅聊Java反序列化之玩转Hessian反序列化的前置知识

目录 序列化 反序列化 Hessian1.0 Hessian2.0 Hessian反序列化核心:MapDeserializer#readMap的利用 总结 序列化 HessianOutput&Hessian2Output都是抽象类AbstractHessianOutput的实现类 HessianOutput#writeObject和Hessian2Output#writeObject的写法是…

Rocketmq专题-01 v5版单机部署篇

Rocketmq专题 注: 本教程由羞涩梦整理同步发布,本人技术分享站点:blog.hukanfa.com 转发本文请备注原文链接,本文内容整理日期:2024-01-28 csdn 博客名称:五维空间-影子,欢迎关注 说明 地址…

通过spring boot/redis/aspect 防止表单重复提交【防抖】

一、啥是防抖 所谓防抖,一是防用户手抖,二是防网络抖动。在Web系统中,表单提交是一个非常常见的功能,如果不加控制,容易因为用户的误操作或网络延迟导致同一请求被发送多次,进而生成重复的数据记录。要针…

分布式思想

1、单体架构设计存在的问题 传统项目采用单体架构设计,虽然可以在一定的程度上解决企业问题,但是如果功能模块众多,并且将来需要二次开发.由于模块都是部署到同一台tomcat服务器中,如果其中某个模块代码出现了问题,将直接影响整个tomcat服务器运行. 这样的设计耦合性太高.不便…

1335:【例2-4】连通块

【算法分析】 设数组vis,vis[i][j]表示(i,j)位置已经访问过。遍历地图中的每个位置,尝试从每个位置开始进行搜索。如果该位置不是0且没有访问过,那么访问该位置,并尝试从其上下左右四个位置开始搜索。在看一个新的位置时&#xff…

C++ //练习 10.34 使用reverse_iterator逆序打印一个vector。

C Primer(第5版) 练习 10.34 练习 10.34 使用reverse_iterator逆序打印一个vector。 环境:Linux Ubuntu(云服务器) 工具:vim 代码块 /**************************************************************…

湖北省建筑安全员C证考试通过后,如何在各平台快速查询

湖北省建筑安全员C证考试通过后,如何在各平台快速查询? 2024年湖北省建筑安全员C证(建安C)证书查询 蛮多人考过建筑安全员C证不知道在哪里查询,建筑行业的安全员C证也称之为专职安全员,建筑安全员ABC /三…

TCP的三次握手和4次挥手

一、首先讲一下TCP的由来 最开始,人们考虑到将网络信息的呼唤与回应进行规范,达成一种公认的协议,就好像没有交通规则的路口设定交通规则。 人们设计出完美的OSI协议,这个协议包含七个层次由下到上分别是: 物理层&…

RuoYi-Vue使用RestTemplate无法通过@Autowired注入报错

A component required a bean of type org.springframework.web.client.RestTemplate that could not be found. 解决方法: 将ruoyi-framework模块下找到ApplicationConfig这个配置类使用Bean注入: /*** RestTemplate配置*/Beanpublic RestTemplate r…