概率论和数理统计(四)方差分析与回归分析

前言

实际场景中,也需要研究两个变量的关系.检验也可能出现两个以上的总体.

方差分析

假设检验中,若需检验 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:μ_1=μ_2,H_1:μ_1 \not=μ_2 H0:μ1=μ2H1:μ1=μ2,则可用t检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知),但如果有两个以上的总体需要检验呢?
H 0 : μ 1 = μ 2 = L = μ s , H 1 : μ 1 , μ 2 , L , μ s 不全相等 H_0:μ_1=μ_2=L=μ_s,H_1:μ_1,μ_2,L,μ_s不全相等 H0:μ1=μ2=L=μsH1:μ1,μ2,L,μs不全相等
这是普遍存在的问题,影响一事物的因素往往很多的,如农业生产中,影响水稻产量的因素可能有:种子、肥料、气象、耕作等;同一种因素下也会有不同的水平状态. 有些因素影响较大,而有些转小,方差分析可以找不那些较显著影响产量的因素.

基本概念

  • 试验指标:在试验中要考察的指标。
  • 因素(因子):影响试验指标的条件。包括可控因素和不可控因素。
  • 单因素试验:在一项试验中只有一个因素在改变的试验。
  • 多因素试验:在一项试验中多于一个因素在改变的试验。
  • 水平:因素所处的状态(每组试验).每个水平下取得的观测值一定是数值型变量,且每个水平下的观测值代表着一个独立的总体分布

方差分析的三个前提假定

在这里插入图片描述

单因素试验的方差分析

单因素方差分析的数据模型如下
在这里插入图片描述
在这里插入图片描述
为了导出检验统计量,我们使用平方和的分解
在这里插入图片描述
X ˉ 是数据的总平均 \bar{X}是数据的总平均 Xˉ是数据的总平均. S T 为总偏差 S_T为总偏差 ST为总偏差,反应全部试验数据的差异.同理,以水平 A j A_j Aj
在这里插入图片描述

  • S E 为误差平方和 S_E为误差平方和 SE为误差平方和,反应水平 A j A_j Aj,样本观察值与样本均值的误差
  • S A 为 u 效应平方和 S_A为u效应平方和 SAu效应平方和,反应水平 A j A_j Aj,样本均值与数据总平均的差异

统计量构造

由定理可知均方为卡方统计量:
在这里插入图片描述

证明过程如下
在这里插入图片描述
在这里插入图片描述

检验水平和检验表格

在这里插入图片描述
得出检验表格

在这里插入图片描述
若给定一个显著水平α=0.05,求出F值,查得P-value(以前没有统计软件的时候,大家是查表来找到显著性水平0.05时对应的F临界值)

  • P-value>0.05,说明:组间误差不显著>组内误差,接受 H 0 H_0 H0
  • P-value<0.05,说明:组间误差不显著<组内误差,拒绝 H 0 H_0 H0

双因素试验的方差分析

与单因素试验的方差分析差不多,同理得检验表格

在这里插入图片描述
在这里插入图片描述

回归分析

回归分析是处理自变量与因变量之间的关系的一种统计方法和技术。而变量间的关系一般有两种:

  • 确定关系,又称函数关系,可用 y = f ( x ) y=f(x) y=f(x)表示。当确定自变量后,因变量被其唯一确定。
  • 相关关系,又称统计关系,它表示变量间密切关联但不能由某个或某些变量唯一确定另一个变量。例如存款和收入密切相关,但收入高并不一定存款高,因为影响存款的因素还有很多,如通货膨胀、投资意识、消费观念。

回归分析就是研究变量间相关关系的一种统计方法。

一元线性回归

在这里插入图片描述
可以发现,上式由两部分组成:

  1. y = a + b x y=a+bx y=a+bx,它是自变量 x x x的确定性关系
  2. 随机误差项 ε \varepsilon ε,它是一个随机变量, 可以看成是 N ( 0 , σ 2 ) N(0,\sigma^2) N(0,σ2)

a,b, σ 2 \sigma^2 σ2估计

在这里插入图片描述
我们称 y ^ = a ^ + b ^ x \hat{y}=\hat{a}+\hat{b}x y^=a^+b^x为随机变量 Y Y Y X X X的回归函数。

在这里插入图片描述
Q Q Q称为残差平方和,再对Q进一步转换
在这里插入图片描述
又因为 S Y Y , S x Y 已知 S_{YY},S_{xY}已知 SYY,SxY已知
在这里插入图片描述

线性假设的显著性检验

在这里插入图片描述

主要参考

《数理统计9.1-方差分析(ANOVA)概念与原理》
《我对方差分析原理的通俗理解,请指正》
《概率论与数理统计知识点提炼(第九章:方差分析及回归分析)》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/177796.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UPLAOD-LABS2

less7 任务 拿到一个shell服务器 提示 禁止上传所有可以解析的后缀 发现所有可以解析的后缀都被禁了 查看一下源代码 $is_upload false; $msg null; if (isset($_POST[submit])) {if (file_exists($UPLOAD_ADDR)) {$deny_ext array(".php",".php5&quo…

LVS负载均衡

LVS 概述 LVS是Linux Virtual Server的缩写&#xff0c;是一种基于Linux内核实现的高可用性、高性能的负载均衡技术。它可以将来自客户端的请求分发到多台服务器上&#xff0c;实现多台服务器的负载均衡&#xff0c;提高整个系统的性能和可用性。 LVS技术主要包括以下几个组件…

(一)QML加载离线地图+标记坐标点

1、实现效果 加载离线地图瓦片、鼠标拖拽、滚轮缩放在地图上固定坐标位置标注地名 &#xff08;一&#xff09;QML加载离线地图标记坐标点&#xff1a;MiniMap全屏 2、实现方法 2.1、使用工具下载离线地图 不废话&#xff0c;直接搬别人的砖&#xff0c;曰&#xff1a;他山之…

Linux系统软件安装方式

Linux系统软件安装方式 1. 绿色安装2. yum安装3. rpm安装3.1 rpm常用命令 4. 源码安装4.1 安装依赖包4.2 执行configure脚本4.3 编译、安装4.4 安装4.5 操作nginx4.6 创建服务器 1. 绿色安装 Compressed Archive压缩文档包&#xff0c;如Java软件的压缩文档包&#xff0c;只需…

微信账单导出的手工操作

文章目录 微信账单导出的手工操作概述笔记手机微信版本电脑版微信版本总体操作流程具体操作END 微信账单导出的手工操作 概述 自己的openpnp设备基本调试完成, 花了不少冤枉钱. 心疼自己:( 如果是大厂有我需要的型号, 这些调试设备的钱都是不必要花的. 厂家的设备到用户手里…

Python小白之环境安装

一、安装包 1、Python开发环境&#xff0c;下载地址&#xff1a; Welcome to Python.org 2、Python工具 Python是强依赖缩进的语言&#xff0c;Node pad等容易有缩进问题&#xff0c;还是使用IDE比较合适&#xff0c;推荐使用PythonCharm。 PythonCharm下载地址&#xff1a…

mac配置双网卡 mac同时使用内网和外网

在公司办公通常都会连内网&#xff0c;而连内网最大的限制就是不可以使用外网&#xff0c;那遇到问题也就不能google&#xff0c;而当连接无线的时候&#xff0c;内网的东西就不可以访问&#xff0c;也就不能正常办公&#xff0c;对于我这种小白来说&#xff0c;工作中遇到的问…

阿里云配置ECS实例的IPv6地址,开通公网IPv6

1.阿里云ECS服务器开通IPv6地址&#xff0c;开通公网IPv6 1.1.官网教程 配置ECS实例的IPv6地址 1.2.相关截图 1.2.1.专有网络VPC开通IPv6 1.2.2.交换机switch开通IPv6 1.2.3.开通IPv6网关并开通公网宽带 1.2.4.ECS服务器绑定IPv6网关 1.2.5.安全组开通IPv6 1.2.6.主机测试I…

ResNet 论文理解含视频

ResNet 论文理解问题导引论文理解Q1.神经网络真的越深越好吗?Q2. 为什么加深网络会带来退化问题&#xff1f;Q3. 如何构建更深层的网络&#xff1f; 基于残差的深度学习框架Residual Learning 的理论依据 网络结构ResNet 的成绩总结 视频理解引入恒等映射 ResNet 论文理解 问…

Think-on-Graph:基于知识图的大型语言模型的深层可靠推理11.12

Hink-on-Graph&#xff1a;基于知识图的大型语言模型的深层可靠推理 摘要1 引言2 方法2.1图上思考2.1.1图的初始化2.1.2 探索2.1.3推理 2.2 基于关系的Think on graph 摘要 尽管大型语言模型&#xff08;LLM&#xff09;在各种任务中取得了巨大的成功&#xff0c;但它们经常与…

Redis应用场景及常见的数据类型

目录 一、Redis应用场景 1.1 Redis作为缓存 1.2 Redis作为消息队列 1.3 实现计数器和排行榜 1.4 实现分布式锁及分布式会话管理 二、Redis常见的数据类型 2.1 String&#xff08;字符串&#xff09;类型 2.2 list类型 2.3 Hash类型 2.4 Set类型 2.5 Sorted Set 一、Redis应用场…