学习笔记|两独立样本秩和检验|曼-惠特尼 U数据分布图|规范表达|《小白爱上SPSS》课程:SPSS第十二讲 | 两独立样本秩和检验如何做?

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 两独立样本秩和检验
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
      • 1、正态性检验
      • 2、两样本秩和检验
    • 四、结果解读
      • 疑问:曼-惠特尼 U数据分布图如何绘制?
    • 五、规范报告
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第十二讲 | 两独立样本秩和检验如何做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

两独立样本秩和检验

前面学习过两独立样本T检验,主要用于数据服从正态分布。
如果遇到数据严重偏态样本数据,可采用两种统计策略:一是将数据转化为正态分布数据;二是采用两独立样本秩和检验,一般用Mann-Whitney U 检验。
秩和检验的原理是将连续型数据排序后分配秩次,再对秩次做假设检验。假设检验的结果表述为“各组数据分布的差异有无统计学意义”。
需指出的是,虽然要重视数据的正态性,但样本量也很重要,如果样本量足够大(比如超过50),只要数据不是那么严重偏态,在近似正态范围内,也可使用t检验,而且更推荐用t检验。

一、实战案例

小白想了解男大侠和女大侠的收入差异。随机抽取了23名男侠和21名女侠,收集了每位大侠的性别和每月平均收入水平。
问,男女大侠之间的收入是否有差异?
读数据:

GETFILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十二讲:两独立样本秩和检验.sav'.

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:比较差异。
比较男侠和女侠收入分布有无统计学差异
Q2:本案例属于什么研究设计?
A:属于随机观察性研究。
事实上,两样本秩和检验也可用于实验性研究。
Q3:有几个变量?
A:有两个变量。
①自变量为性别
②因变量为收入
Q4:变量类型是什么?
A:自变量为分类变量
因变量为连续型变量。
Q5:连续型变量服从正态分布么?
A:需要检验。
Q6:可采用何种统计方法?
A:若服从,采用两独立样本T检验;
若不服从正态,可采用两样本秩和检验。
概括而言,如果数据满足以下条件,则采用两独立样本秩和检验。在这里插入图片描述

三、SPSS操作

1、正态性检验

命令行:

EXAMINE VARIABLES=收入  BY  性别/PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*//COMPARE GROUPS /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.

正态性检验结果:
在这里插入图片描述
直方图:
在这里插入图片描述
在这里插入图片描述
经S-W检验结果显示:男侠组收入P=0.332,女侠组收入P=0.002<0.01。同时结合直方图,可认为,男侠组服从正态分布,而女侠组不符合正态分布,建议采用两样本秩和检验。

2、两样本秩和检验

Step1 : 依次点击“分析—非参数检验–旧对话框–2个独立样本”,弹出两个独立样本检验对话框。
在这里插入图片描述
Step2 : 点击“收入”放入“检验变量”,性别放入“分组变量”同时进行定义组。
①检验类型:曼-惠特尼 U(Man-whttey U),是最常见的两样本秩和检验
②检验变量:即放入结局指标,本例为收入
③分组变量:放入性别。这里“定义组”需要进一步明确。
定义组:即指定比较哪两组。
在本例,我们比较男侠和女侠组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。
再次提醒:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。
④选项:对总体数据进行基本的统计描述
在这里插入图片描述
继续,确定,输出结果。
命令行:

NPAR TESTS /M-W= 收入 BY 性别(1 2) /STATISTICS=DESCRIPTIVES QUARTILES /MISSING ANALYSIS.

四、结果解读

根据上述SPSS操作,秩和检验将提供3张表格。
表1:提供对收入的总体描述
在这里插入图片描述
表2:提供分组描述收入平均排名(秩平均值)和总排名(秩总和)在这里插入图片描述
统计描述为各组的“平均秩次”和“秩总和”,然而,“平均秩次”和“秩总和”并不能充分反映各组数据的集中趋势。一般论文不报告秩平均和秩总和。
那报告什么呢?
对于非正态分布数据,中位数是描述其集中趋势的较好指标,四分位数是描述离散趋势的较好指标。
对于正态分布数据,均数是描述其集中趋势的较好指标,标准差是描述离散趋势的较好指标。
表3:秩和检验分析结果在这里插入图片描述
曼-惠特尼U(Mann-Whitney U)和威尔克森W(Wilcoxon)是常用的两独立样本秩和检验方法。
两者的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。
我们主要关注Z值和对应的p值。本案例的Z=-0.787,p=0.431>0.05, 表明两者的数据分布无显著性差异(数据分布图如下所示):

疑问:曼-惠特尼 U数据分布图如何绘制?

请选择“分析”——“非参数检验”——“独立样本”方式,在“设置”中选择“曼-惠特尼U”检验,确定
在这里插入图片描述
在这里插入图片描述
即可输出该图:
在这里插入图片描述

命令行:

*Nonparametric Tests: Independent Samples. 
NPTESTS /INDEPENDENT TEST (收入) GROUP (性别) MANN_WHITNEY /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE/CRITERIA ALPHA=0.05  CILEVEL=95.

五、规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

表 男女大侠收入差异比较在这里插入图片描述
注:数据不服从正态时,不能用平均数和标准差来描述;而应采用中位数和四分位距(第25百分位数和第75百分位数之距离)来描述。
如何获得中位数?详见第二讲|描述性统计,你学会了吗?

2、规范文字

经S-W检验以及直方图结果显示,女侠这一组数据不服从正态分布,故采用两样本Mann-Whitney U检验。
结果显示,男侠组收入的中位数11014.6(10168.9,11860)元,女侠组的中位数11739.5(10878.8,12600.3)元,两组总体收入分布不存在统计差异(Z=0.787,p =0.431)。

六、划重点

1、两独立样本的秩和检验主要是用于次序数据或不满足正态分布的连续型数据,一般用Mann-Whitney U检验。
2、如果数据严重偏态分布或存在若干个极端异常值,至少一组数据正态性检验p值接近0.01或者<0,01,优先考虑秩和检验。
3、秩和检验的描述性统计应采用中位数和四分位距(25%和75%位数),而非平均数和标准差。
小白学完两节秩和检验课程,心里又有几分成就感。
他想到了之前学习的配对样本T检验。如果数据不服从正态分布,那么也不适合T检验见,应该有配对秩和检验吧!
是的,小白思路没错,下一讲:配对样本秩和检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/157775.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

频谱仪超外差和零中频架构

文章目录 超外差结构零中频结构接收机结构发射机结构 优缺点对比附录相关词汇多次变频的形象解释 参考文献 频谱仪的本质就是一个超宽带、超宽调谐范围、高动态范围的通信接收机&#xff0c; 频谱仪的原理即通信接收机的原理。 遇到高频率高带宽谐波成分复杂的通信信号的话&am…

关于idea使用的一些操作设置

关于idea使用的一些操作设置 1. 常用的一下设置1.1 快捷键相关1.2 配置自动生成注释&#xff08;类、方法等&#xff09;1.3 maven项目相关1.4 常见其他的一些操作设置 2. IntelliJ IDEA 取消param注释中参数报错提示3. idea同时打开多个文件&#xff0c;导航栏不隐藏、自动换行…

AI时代新宠,向量数据库

随着生成式人工智能&#xff08;GAI&#xff09;应用以及大语言模型&#xff08;LLM&#xff09;的快速发展&#xff0c;一种新型数据库也获得了市场和资本的重点关注&#xff0c;它就是向量数据库&#xff08;Vector Database&#xff09;。 向量数据库简介 向量数据库是一种…

微信小程序自定义弹窗阻止滑动冒泡catchtouchmove之后弹窗内部内容无法滑动

自定义弹窗 如图所示&#xff1a; 自定义弹窗内部有带滚动条的盒子区域 问题&#xff1a; 在盒子上滑动&#xff0c;页面如果超出一屏的话&#xff0c;也会跟着一起上下滚动 解决方案&#xff1a;给自定义弹窗 添加 catchtouchmove 事件&#xff0c;阻止冒泡即可 网上不少…

【C++】C++11【上】列表初始化|声明|新容器|右值引用|完美转发|新的类功能

目录 1、 C11简介 2、 统一的列表初始化 2.1 &#xff5b;&#xff5d;初始化 2.2 std::initializer_list 3、声明 3.1 auto和范围for 3.1decltype 3.3 nullptr 4、新容器 5、 右值引用 5.1左值引用和右值引用 5.2 左值引用与右值引用比较 5.3 左值和右值引用使用场景及意义 6…

2023年【低压电工】考试及低压电工模拟考试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 低压电工考试根据新低压电工考试大纲要求&#xff0c;安全生产模拟考试一点通将低压电工模拟考试试题进行汇编&#xff0c;组成一套低压电工全真模拟考试试题&#xff0c;学员可通过低压电工模拟考试题全真模拟&#…

2023/10/29总结

总结 踩坑记录 写代码的时候遇到了一个错误大概是这样的 io.jsonwebtoken.security.WeakKeyException: The signing keys size is 48 bits which is not secure enough for the HS256 algorithm. The JWT JWA Specification (RFC 7518, Section 3.2) states that keys used…

pycharm使用ssh连接远程jupyter

1. 安装jupyter pip install jupyter2. 生成jupyter_notebook_config.py文件 jupyter notebook --generate-config3. 设置命令参数 jupyter notebook --no-browser --allow-root --port 8900配置Jupyter服务器 将上面的代码复制到命令行实参中&#xff1a;

管理类联考——数学——汇总篇——知识点突破——代数——函数、方程——记忆

文章目录 考点记忆/考点汇总——按大纲 整体局部 本篇思路&#xff1a;根据各方的资料&#xff0c;比如名师的资料&#xff0c;按大纲或者其他方式&#xff0c;收集/汇总考点&#xff0c;即需记忆点&#xff0c;在通过整体的记忆法&#xff0c;比如整体信息很多&#xff0c;通常…

Day17力扣打卡

打卡记录 参加会议的最多员工数&#xff08;拓扑排序 分类讨论&#xff09; 链接 计算内向基环树的最大基环&#xff0c;基环树基环为2的情况分类讨论。 class Solution { public:int maximumInvitations(vector<int> &favorite) {int n favorite.size();vector…

动作捕捉系统进行坐标系转换

动作捕捉系统在机器人等应用中常出现被测物与动捕坐标系不一致的问题。这时就需要进行坐标系的转换。在NOKOV度量动作捕捉系统软件中&#xff0c;可以对被测物的坐标系原点偏移量进行设置&#xff0c;实现被测物坐标系与大地坐标系的重合。 一、坐标系偏移操作 在形影动捕软件…

IOI车机系统刷机和改包笔记2 - 改包脚本

前言&#xff1a; 最近对雪佛兰改包需求感兴趣的网友很多&#xff0c;大家都遇上了很多奇怪的问题&#xff0c;这里就我自己使用的环境和脚本进行分享&#xff0c;供大家参考。 1. 准备环境 我这里使用Ubuntu系统进行操作 andyandy-vm:~$ sudo lsb_release -a No LSB module…