如何用自助法或刀切法来估计偏差、方差?

自助法和刀切法(也叫水手刀法)为计算标准误差和置信区间的非参数方法。刀切法耗费较少计算机资源,但自助法有某些统计优势。

1. 刀切法

由Quenouille(1949)提出的刀切法是用来对估计的偏差和方差进行近似的一个简单方法。

符号说明:

  • T_n=T(X_1,...,X_n):估计\theta的一个统计量。
  • bias(T_n)=\mathbb{E}(T_n)-\theta:估计的偏差。
  • T_{(-i)}:去掉第i个观测值之后的统计量。
  • \overline T_n=n^{-1}\sum\limits_{i}T_{(-i)}:计算所有T_{(-i)}的均值。
  • \widetilde{T_i}=nT_n-(n-1)T_{(-i)}伪值(pseudo-value)。
  • \widetilde{s}^2=\frac{\sum\limits_{i=1}^n(\widetilde{T_i}-\frac{1}{n}\sum\limits_{i=1}^n\widetilde{T_i})^2}{n-1}:伪值的样本方差。

定义:

  • 刀切法的偏差估计:b_{jack}=(n-1)(\overline T_n-T_n)
  • 刀切法的修正后统计量:T_{jack}=T_n-b_{jack}=\frac{1}{n}\sum\limits_{i=1}^n\widetilde{T_i}
  • 刀切法的方差估计:v_{jack}=\frac{\widetilde{s}^2}{n}

解释:

  • 偏差:

对于很多统计量,能够表明,对于某些a和b,满足:

bias(T_n)=\frac{a}{n}+\frac{b}{n^2}+O(\frac{1}{n^3})
bias(T_{(jack)})=\frac{b}{n(n-1)}+O(\frac{1}{n^2})=O(\frac{1}{n^2})

T_{jack}的偏差在阶数上小于T_n的偏差。

  • 方差

在关于T的适当条件下(例如T为样本均值的一个光滑函数),能够显示,v_{jack}\mathbb{V}(T_n)的相合估计。

2. 自助法

自助法(bootstrap)是估计一个统计量T_n=g(X_1,...,X_n)的方差和分布的个方法。还能利用自助法来构造置信区间。

  • 自助法方差估计:

(1) 抽样:X_1^*,...,X_n^*\sim \widehat{F_n}

(2) 计算:T_n^*=g(X_1^*,...,X_n^*)

(3) 重复步骤(1)和(2) B 遍,得到:T_{n,1}^*,...,T_{n,B}^*

(4) 令v_{boot}=\frac{1}{B}\sum\limits_{b=1}^B\biggl(T_{n,b}^*-\frac{1}{B}\sum\limits_{r=1}^BT_{n,r}^* \biggl)^2

  • 自助法T_n的CDF近似

G_n(t)=\mathbb{P}(T_n\leq t),\ \widehat{G}^*_n(t)=\frac{1}{B}\sum\limits_{b=1}^B I(T_{n,b}^*\leq t)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/323008.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业数据治理的三个阶段:从起步到成熟的数据管理之旅

随着数字化时代的到来,企业数据已经成为企业的重要资产和驱动业务发展的重要力量。然而,要想充分利用数据的价值,企业需要对其数据进行有效的管理和治理。本文将对企业数据治理的三个阶段进行详细的探讨,以帮助企业了解其在数据治…

基于springboot精品水果线上销售网站设计与实现

🍅点赞收藏关注 → 私信领取本源代码、数据库🍅 本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目希望你能有所收获,少走一些弯路。🍅关注我不迷路🍅一 、设计说明 1.1 研究背景 互…

从零学Java - 面向对象 Static

面向对象 Static 文章目录 面向对象 Static1.什么是静态?2.Static的作用2.1 属性2.1.1 实例属性2.1.2 静态属性 2.2 方法2.2.1 静态方法 2.3 代码块2.3.1 局部代码块2.3.2 动态代码块2.3.3 静态代码块 2.4 静态导入 3.类加载3.1 什么是类加载?3.2 触发类加载的5种情况3.3 类加…

8K超高清应用:输电线网智慧巡检提升巡视效率

电力安全关系国计民生,是国家安全的重要保障,因此确保电力线路系统的安全运行至关重要。电力线路系统整体分为三大板块:输电线路、变电站和配电线路。然而,由于自然灾害、人为破坏等因素影响,这三大板块的设备很容易发…

【mujoco】Ubuntu20.04中解决mujoco报错raise error.MujocoDependencyError

【mujoco】Ubuntu20.04中解决mujoco报错raise error.MujocoDependencyError 文章目录 【mujoco】Ubuntu20.04中解决mujoco报错raise error.MujocoDependencyError1. 报错的具体情况2. 解决过程3. 其他问题3.1 ModuleNotFoundError: No module named OpenGL3.2 ModuleNotFoundEr…

【kettle】pdi/data-integration 打开ktr文件报错“Unable to load step info from XML“

一、报错内容: Unable to load step info from XML step nodeorg.pentaho.di.core.exception.KettleXMLException: Unable to load step info from XMLat org.pentaho.commons.launcher.Launcher.main (Launcher.java:92)at java.lang.reflect.Method.invoke (Met…

web动态月球特效

文章目录 效果预览文件分布代码 效果预览 文件分布 代码 鼠标点击特效 fireworks.js class Circle {constructor({ origin, speed, color, angle, context }) {this.origin originthis.position { ...this.origin }this.color colorthis.speed speedthis.angle anglethi…

性能优化-OpenMP基础教程(四)-全面讲解OpenMP基本编程方法

本文主要介绍OpenMP编程的编程要素和实战,包括并行域管理详细实战、任务分担详细实战。 🎬个人简介:一个全栈工程师的升级之路! 📋个人专栏:高性能(HPC)开发基础教程 🎀C…

MySQL面试题汇总

常规: 1、数据库三大范式 1NF : 表中字段的数据不可再拆分。(原子性)2NF : 在满足第一范式的情况下,遵循唯一性,消除部分依赖。即,表中任意一个主键或任意一组联合主键,可以确定除该主键外的所有的非主键值。(一个表…

uniapp 无限级树形结构面包屑、单选-多选、搜索、移除功能插件,基于【虚拟列表】高性能渲染海量数据,加入动态高度、缓冲区

hyq-tree-vtw 无限级树形结构面包屑、单选-多选、搜索、移除功能 示例项目 单选-user 单选-任意一项 多选-关联下级 多选-任意一项 已选择数据弹框 说明 本插件需要使用uni-popup、uni-transition用于已选择数据弹框,因此需要有这些依赖,请自行导入本插件基于【虚…

如何通过Python将各种数据写入到Excel工作表

在数据处理和报告生成等工作中,Excel表格是一种常见且广泛使用的工具。然而,手动将大量数据输入到Excel表格中既费时又容易出错。为了提高效率并减少错误,使用Python编程语言来自动化数据写入Excel表格是一个明智的选择。Python作为一种简单易…

医院信息系统集成平台—医院决策分析平台(2)

“医院决策分析系统”需求主要包括五部分工作内容:数据库设计、指标库的构建、指标数据的采集、指标分析及展现。 指标加工逻辑架构 下图描述的是物理的数据存储与业务上的指标库之间的映射关系。事实上,整个“指标库”建立和管理的核心问题就是,业务人员所使用的指标与物…