Minitab的单因子方差分析的结果

单因子方差分析概述

当有一个类别因子和一个连续响应并且想要确定两个或多个组的总体均值是否存在差异时,可使用 单因子方差分析。如果经检验,发现至少有一组存在差异,请使用单因子方差分析中的比较对话框来标识存在显著差异的组对。

例如,地毯制造商想要确定几种类型的地毯的耐久性是否存在差异。

要执行单因子方差分析,请选择菜单:统计 > 方差分析 > 单因子。

何时使用备择分析

  • 如果具有两个或更多固定类别因子,则在具有所有固定因子时使用拟合一般线性模型,或在具有随机因子时使用拟合混合效应模型。
  • 如果标绘一个连续(数值)预测变量和一个连续响应之间的关系,请使用拟合线图
  • 如果有多个预测变量,请使用拟合回归模型。

数据注意事项

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

  • 数据应当仅包括一个作为固定因子的类别变量。
  • 响应变量应当是连续变量。如果响应变量是类别变量,则模型不太可能满足分析假定、准确描述数据或者进行有用的预测。
  • 样本数据应当来自正态总体,或者每个样本的数量应当大于 15 或 20。如果样本数量大于 15 或 20,则检验对于偏斜的非正态分布表现得非常好。如果样本数量小于 15 或 20,则对于非正态分布来说,结果可能会具有误导性。
  • 每个观测值都应当独立于所有其他观测值。如果观测值是相关的,则结果可能无效,请转到分析重复测量设计
  • 使用最佳做法收集数据。
  • 模型应当提供良好的数据拟合。

单因子方差分析示例

某化学工程师想要比较四种油漆混料的硬度。每种油漆混料取六份样品涂到一小块金属上,待金属块凝固后再测量每种样品的硬度。为了检验均值是否相等,并评估均值对之间的差分,分析师配合使用单因子方差分析和多重比较。数据如下表:

油漆硬度温度操作员
配方 214.930.31
配方 31330.92
配方 41530.52
配方 11729.43
配方 113.9303
配方 316.429.61
配方 110.429.62
配方 23.229.92
配方 21.928.92
配方 27.328.61
配方 417.830.83
配方 29.630.83
配方 422.928.91
配方 417.430.63
配方 313.329.83
配方 119.3301
配方 116.129.93
配方 36.530.62
配方 111.730.13
配方 416.930.73
配方 418.429.91
配方 311.929.52
配方 214.529.91
配方 316.829.93

对上述数据进行单因子分析,对话框设置如下,同时“比较”选择“Tukey”的方式:

主要结果分析

主要输出包含 p 值、组图、组比较、R2 和残差图。

步骤 1:确定组均值之间的差分在统计意义上是否显著

要确定均值之间的任何差值在统计意义上是否显著,请将 p 值与显著性水平进行比较以评估原假设。原假设声明总体均值均相等。通常,显著性水平(用 α 或 alpha 表示)为 .05 即可。显著性水平 .05 指示在实际上不存在差异时得出存在差异的风险为 5%。

P 值 ≤ α:一些均值之间的差值在统计意义上显著

如果 p 值小于或等于显著性水平,则否定原假设并得出并非所有总体均值都相等的结论。使用您的专业知识可以确定差值实际上是否显著。

P 值 > α:均值之间的差值在统计意义上不显著

如果 p 值大于显著性水平,则您没有足够的证据否定原假设(总体均值相等)。请确认检验具有足够的功效来检测在实际意义上显著的差值

主要结果:P 值

在这些结果中,原假设表明 4 种不同的油漆的硬度均值相等。因为 p 值小于显著性水平 0.05,则可以否定原假设并得出部分油漆的均值不同。

步骤 2:检查组均值

使用区间图可显示每个组的均值和置信区间。区间图显示如下内容:

  • 每个点号都代表样本均值。
  • 每个区间针对组均值具有 95% 的置信区间。组均值位于组的置信区间内的置信度为 95%。

重要信息:请谨慎解释这些区间,因为进行多重比较时出现类型 1 错误的比率会增加。也就是说,当您增加比较数后,至少有一个比较将错误得出其中一个观测差分会显著不同的概率也会相应增加。

在区间图中,混料 2 具有最低均值,混料 4 具有最高均值。从图形中不能确定任何差分是否在统计意义上显著。要确定统计显著性,请评估均值差分的置信区间。

步骤 3:比较组均值

如果单因子方差分析 p 值小于显著性水平,您将知道部分组均值是不同的,但组对的情况并非如此。针对均值差分使用分组信息表和检验可确定特定组对之间的均值差分是否在统计意义上显著,并且根据差异程度进行估计。

  • 分组信息表

使用分组信息表可快速确定任何组对之间的均值差值在统计意义上是否显著。不共享字母的组存在显著差异

  • 均值差分检验

    使用置信区间可确定差分的可能范围并确定差分是否具有实际显著性。表格会显示均值对之间差分的一组置信区间。均值差分的区间图会显示相同的信息。不包含零的置信区间表示统计意义显著的均值差分。

主要结果:均值、分组

在这些结果中,表显示组 A 包含混料 1、3 和 4,组 B 包含混料 1、2 和 3。混料 1 和混料 3 处于两个组中。共享一个字母的均值之间的差分在统计意义上不显著。混料 2 和混料 4 不共享一个字母,这表明混料 4 的均值比混料 2 的均值明显高很多。

主要结果:整体置信水平 95% CI,单个置信水平

在 Tukey 结果中,置信区间指示如下内容:

  • 混料 2 和 4 的均值之间差分的置信区间为 3.11 到 15.89。此范围不包含零,表明这些差分在统计意义上显著。
  • 其余均值对的置信区间都包括 0,表明这些差分在统计意义上不显著。
  • 95% 的整体置信水平表明所有置信区间包含实际差分的置信度可能是 95%。
  • 该表指示单个置信水平为 98.89%。此结果表明每个单个区间包含特定组均值对之间实际差分的置信度可能为 98.89%。每个比较的单个置信水平会针对所有六种比较产生 95% 的整体置信水平。

步骤 4:确定模型与数据拟合的程度

  • S

使用 S 可评估模型描述响应值的程度。S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。应检查残差图来验证假设。

  • R-sq

R2 是由模型解释的响应中的变异百分比。R2 值越高,模型拟合数据的优度越高。R2 始终介于 0% 和 100% 之间。高 R2 值表示模型不符合模型假设。您应检查残差图来验证假设。

  • R-Sq(预测)

使用预测的 R2 可确定模型对新观测值的响应进行预测的程度。具有较大预测 R2 值的模型的预测能力也较出色

实质上小于 R2 的预测的 R2 可能表明模型过度拟合。在向总体中添加不太重要的影响项的情况下,可能会发生过度拟合模型。模型针对样本数据而定制,因此可能对于总体预测不太有效。

在比较模型方面,预测的 R2 还可能比调整的 R2 更有效,因为它是用模型计算中未包含的观测值计算得出的。

主要结果:S、R-sq、R-sq(预测)。在这些结果中,因子对响应中 47.44% 的变异给出了解释。S 表示数据点和拟合值之间的标准差约为 3.95 个单位。

步骤 5:确定模型是否符合分析的假设条件

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。

残差与拟合值图

使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。

下表中的模式可能表示该模型不满足模型假设。

模式模式的含义
残差相对拟合值呈扇形或不均匀分散异方差
远离 0 的点异常值

 在此残差图与拟合图中,点随机散落在图上。没有组看起来具有明显不同的变化,并且没有明显的异常值。

残差与顺序图

使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布。

如果查看模式,便可查出原因。下列类型的模式可能表明残差属于依赖项。

趋势:偏移:周期:

在此残差与顺序图中,残差似乎会围绕中心线随机衰减。

残差的正态概率图

使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。下表中的模式可能表示该模型不满足模型假设。

模式模式的含义
非直线非正态性
远离直线的点异常值
斜率不断变化未确定的变量

 注意:如果单因子方差分析设计符合样本数量原则,则结果不会受正态性偏离的显著影响。

在此正态概率图中,残差通常看起来是一条直线。从残差图与拟合图中,可以看到四个组中的每一个都具有六个观测值。由于此设计不符合样本数量规则,所以满足正态假设很重要,因而检验结果是可靠的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/344092.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Win10安装配置Redis,修改密码

一、下载Redis tporadowski 提供了 支持 Windows平台的 Redis 安装包,目前仍在维护,目前最新版本是 5.0.14,更新速度跟Redis官网也相差好几个大版本。 下载地址:https://github.com/tporadowski/redis/releases 二、Redis 安装 …

MATLAB - 卫星自旋的模型参考自适应控制(MRAC)

系列文章目录 前言 本例展示了如何使用模型参考自适应控制 (MRAC) 控制卫星自旋,使未知控制系统与理想参考模型相匹配。卫星系统在 Simulink 中建模,MRAC 控制器使用 Simulink Control Design™ 软件提供的模型参考自适应控制模块实现。 一、卫星旋转控…

CCF模拟题 202309-2 坐标变换(其二)

问题描述 试题编号: 202309-2 试题名称: 坐标变换(其二) 时间限制: 1.0s 内存限制: 512.0MB 问题描述: 对于平面直角坐标系上的坐标 (x,y),小 P 定义了如下两…

仓储|仓库管理水墨屏RFID电子标签2.4G基站CK-RTLS0501G功能说明与安装方式

随着全球智能制造进度的推进以及物流智能化管理水平的升级,行业亟需一种既能实现RFID批量读取、又能替代纸质标签在循环作业、供应链管理以及实现动态条码标签显示的产品。在此种行业需求背景下,我是适时推出了基于墨水屏显示技术的VT系列可视化超高频标…

Office Tool Plus v10.6.2.0绿色版

软件介绍 Office Tool Plus(简称OTP)是一款微软Office办公软件下载、安装、管理的辅助增强工具。它可以快速自定义部署,在线下载安装 Office 的各个版本,也可以通过已有的离线安装文件来部署Office镜像,同时在安装过程…

百家大吉·夕阳关爱——昌岗街微型养老博览会

居民热情参与博览会 为让长者了解及选择适合自己的养老服务,昌岗街在2023年12月27日开展以“百家大吉夕阳关爱”为主题的昌岗街微型养老服务公益博览会活动,通过搭建养老服务机构供需服务平台,拓宽社区长者了解正规养老服务机构的渠道&#…

Java中的栈和队列操作,相互实现(力扣 232, 225)

栈和队列(Java) Java中的 栈 & 队列 操作栈的使用队列的使用 LeetCode 232. 用栈实现队列我的代码 LeetCode 225. 用队列实现栈我的代码 Java中的 栈 & 队列 操作 栈的使用 栈的方法功能Stack()构造一个空的栈E push(E e)将e入栈,并…

与纸质合同相比,电子合同有哪些优势?

在无纸化办公的当下,电子合同软件成为了企业数字化转型必不可少的工具。而随着国内电子合同软件功能的完善,电子合同拥有便捷,安全,功能等要素,因此,电子合同是更多人的选择方式。 电子合同指的是双方或者多…

【卡梅德生物】单B细胞技术:牛单抗制备

1.牛单B细胞技术原理 单个B细胞抗体制备技术是近年来新发展的一类快速制备单克隆抗体的技术,基于流式细胞分选技术进行单B细胞单抗制备,利用每个B细胞只含有一个功能性重链可变区DNA序列和一个轻链可变区DNA序列且只产生一种特异性抗体的特性&#xff0c…

Linux的DNS域名解析服务

一.DNS基础 1.1 DNS简介 DNS域名系统 (Domain Name System 缩写为:DNS)是因特网的一项核心服务,它作为可以将 域名 和 IP地址 相互映射的一个分布式数据库,能够使人更加方便的访问互联网,而不用去记住能够…

依赖注入的优缺点与最佳实践

1 什么是依赖注入 依赖注入,全称Dependency Injection,简称DI。 在我们深入探讨之前,先来聊聊“依赖”和“注入”这两个比较术语的词。打个比方,你可以把“依赖”想象成电器设备的外接电线,而“注入”就像是把这根电…

专业课120+总分380+海南大学838信号与系统考研经验分享-电子信息,信息与通信,人工智能,生物医学

今年专业课120,总分380顺利被海大录取,总结一下这一年来的复习经验,希望对大家复习有借鉴。特别提醒这两年专业课海南大学838信号与系统难度比较大,还考察了IDTFT,DTFT等,对离散域的考察颇多,不…