使用SPSS分析数据简单教程

1. SPSS

SPSS原名社会科学统计包Statistical Package for the Social Sciences),SPSS公司于2000年正式将英文全称更改为统计产品与服务解决方案Statistical Product and Service Solutions)。2009年7月28日,SPSS公司宣布该公司被IBM收购。

2. 解决什么问题?

一般我们使用SPSS来对数据进行处理和结果分析,常见的场景是显著性的计算,通过计算p值来得出2个因素之间是否存在显著性的关联。

2.1 显著性

有关显著性这里我们只简单记住2个概念,一个是显著性水平Significance Level

显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
常见的值如0.05或0.01。它代表了研究者愿意承担的犯第一类错误(错误地拒绝真实的原假设)的最大概率。
显著性水平帮助研究者控制假阳性结果的出现,即错误地认为处理效应是有意义的,而实际上可能是由于随机误差所致。‌

一个是P值probably value

P值是在原假设为真的情况下,观察到当前数据或更极端数据的概率。
P值衡量了观察到的效果在统计上显著的证据强度。
如果P值小于显著性水平(例如0.05),研究者通常会拒绝原假设,认为观察到的效果是统计显著的。
P值越小,拒绝原假设的理由越充分,表明观察到的效果不太可能是由随机误差产生的。‌

总结来说,显著性水平是研究者设定的一个标准,用于控制假阳性的出现概率;而P值是根据实际数据计算出来的,用于评估观察到的效果是否足够显著以拒绝原假设。
简而言之:p>α 推翻原假设,p<α 维持原假设。

3. 根据不同数据类型选择不同的处理方法

3.1 连续变量

首先对数据进行正态性检验(见3.1.1),如果数据符合正态分布,参照上表,根据组的数量,进行独立样本T检验(见3.1.2)或者单因素ANOVA(Analysis of Variance,方差分析,见3.1.3);如果数据不符合正态分布,参照上表,根据组的数量,进行曼-惠特尼 U 检验或者克鲁斯卡尔-沃利斯检验(见3.1.4)。

3.1.1 正态性检验




3.1.1.1 正态性检验结果解读


一般我们取显著性水平α=0.05,在输出的上表结果中,可以看到有左右2部分,分别采用了Kolmogorov-Smirnov (K-S) 检验Shapiro-Wilk (S-W) 检验,简单来讲,K-S适用于样本较大(n ≥ 50)的情况,S-W适用于小样本(n < 50)情况。但是一般来讲,样本数量<100使用S-W都是可行的。我们不能只关注p值,也要同时查看Q-Q图来辅助决策

如上图,如果点的分布与直线偏差不大,同时p值>0.05,那么我们便可以认为原假设成立,即:数据符合正态分布,否则则不是正态分布。

3.1.2 独立样本T检验




3.1.2.1 如何将一个变量重新编码成新的分组变量

例如上面提到的术后90天mRS评分是一个包含0~6共7个参数的分类变量,但是我们只需要将评分划分为2个组,那么就需要根据计算规则重新生成一个分组变量,操作如下


点击变化量


按范围添加
这样就生成了一个新的分组变量。

3.1.2.2 独立样本T检验结果解读


上图是结果输出,我们主要关注下表。
可以看到下表分为左右2部分,左边是Levene检验用于校验方法齐性,右边是t检验结果,上图中假定等方差的p = 0.054 > 0.05于显著性水平,拒绝原假设,认为方差是不相等的。所以看下面的那条数据(通常称为Welch's t检验)。
p = 0.090 > 0.05 ,不拒绝原假设,认为年龄和分组没关系。

3.1.3 单因素ANOVA检验



3.1.3.1 单因素ANOVA检验结果解读


p = 0.128 > 0.05 ,不拒绝原假设,认为年龄和评分没关系。

3.1.4 曼-惠特尼 U 检验




一般让SPSS自己选择方法就行了,也可以自己定制。

3.1.4.1 曼-惠特尼 U 检验结果解读


p = 0.654 > 0.05 ,不拒绝原假设,认为2者没关系。
我们选择一个>=3个分组的数据,就是克鲁斯卡尔-沃利斯检验了。

3.2 分类变量

卡方检验主要用于以下两种情况:
独立性检验 (Test of Independence):检验两个分类变量之间是否存在关联。例如,性别和喜欢的颜色之间是否有关联。
拟合优度检验 (Goodness of Fit Test):检验观察到的频率分布是否符合预期的频率分布。

3.2.1 卡方检验



3.2.1.1 卡方检验结果解读


主要关注第一行,皮尔逊卡方(Pearson Chi-Square)
p 值 = 1:这意味着检验的观察值与预期值完全吻合,几乎不可能出现这样的情况。通常来说,p 值为 1 表示没有任何证据反对零假设,换句话说,数据完全支持零假设(即变量之间没有关联)。
我们换个数据

如果p 值小于 0.05,说明在 95% 的置信水平下,我们可以拒绝零假设,表明变量之间存在显著关联。
但是上表中 p = 0.456 不能拒绝零假设,说明糖尿病和轻重症没有显著关联。

注意事项:
期望频数:检查每个单元格的期望频数,如果有单元格的期望频数低于 5,结果可能不可靠。SPSS 会在输出中显示期望频数。
数据量:确保数据量足够大,样本量过小会影响卡方检验的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/773714.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jmeter之读取csv文件踩坑记

CSV Data Set Config是JMeter中用于参数化测试的关键元件,其主要功能是从CSV文件中读取数据,并将这些数据作为变量提供给测试脚本使用。这种元件在模拟多用户、不同输入或其他测试用例时非常有用。以下将详细介绍CSV Data Set Config的各个参数及其作用: 文件名:可以填写文…

编译期链接时共享库搜索路径优先级实验

做实验验证共享库在编译期链接时库路径搜索的优先级目录前言实验环境目录说明准备工作单独测试不配置路径默认路径LIBRARY_PATH-L优先级测试默认路径和LIBRARY_PATH-L和默认路径DEBUG模式编译器配置详细信息链接器详细信息DEBUG总结验证默认路径>LIBRARY_PATH原因附录库文件…

共享库编译期链接优先级实验

做实验验证共享库在编译期链接时库路径搜索的优先级目录前言实验环境目录说明准备工作单独测试不配置路径默认路径LIBRARY_PATH-L优先级测试默认路径和LIBRARY_PATH-L和默认路径DEBUG模式编译器配置详细信息链接器详细信息DEBUG总结验证默认路径>LIBRARY_PATH原因附录库文件…

ComfyUI插件:ComfyUI Impact 节点(三)

前言: 学习ComfyUI是一场持久战,而 ComfyUI Impact 是一个庞大的模块节点库,内置许多非常实用且强大的功能节点 ,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修…

CSP11

CSP11 T1暴力 #include <bits/stdc++.h> #define speed() ios::sync_with_stdio(false),cin.tie(0),cout.tie(0); #define ll long long #define ull unsigned long long #define lid (rt<<1) #define rid (rt<<1|1) // #define endl \n //#define int long …

Ansible管理密码库文件

ansible可能需要访问密码或API密钥等敏感数据,以便能配置受管主机。通常,此信息可能以纯文本形式存储在清单变量或其他Ansible文件中。但若如此,任何有权访问Ansible文件的用户或存储,这些Ansible文件的版本控制系统都能够访问此敏感数据。这存在安全风险。使用Ansible随附…

Ansible忽略任务失败

在默认情况下,任务失败时会中止剧本任务,不过可以通过忽略失败的任务来覆盖此类行为。在可能出错且不影响全局的段中使用ignore_errors关键词来达到目的。 环境: 受控主机清单文件: [dev] 192.168.10.129 [all:vars] ansible_ssh_user=root ansible_ssh_pass=123 编写yum文…

React 的 KeepAlive 实战指南:深度解析组件缓存机制

Vue 的 Keep-Alive 组件是用于缓存组件的高阶组件,可以有效地提高应用性能。它能够使组件在切换时仍能保留原有的状态信息,并且有专门的生命周期方便去做额外的处理。该组件在很多场景非常有用,比如:tabs 缓存页面分步表单路由缓存 在 Vue 中,通过 KeepAlive 包裹内…

LangChain补充七:Hub和LangSmith入门

一:Hub简介 https://blog.csdn.net/DEVELOPERAA/article/details/139983286 (一)简介 1.早期 最开始的LangChainHub,类似于github一样,可以理解为LangChain 工具包 或者说 组件中心,里面提供了高质量的组件方便开发者使用。确确实实是一个分享和探索Prompt、链 和Agent的…

借助大语言模型快速升级你的 Java 应用程序

大家都知道我爱小 Q。在我“转码”的征程中,它就像上帝之手,在我本该枯燥漫长的学习进程中拉满快进条。 不仅是我,最近 Amazon Q Developer 还帮助 Amazon 一个由 5 人组成的团队在短短两天内将 1,000 多个生产应用程序从 Java 8 升级到 Java 17(每个应用程序的平均时间不到…

8080端口被占用

微服务项目,启动时发生8080端口占用,但是其他启动了并没有使用到8080端口。 cmd命令窗口查看: netstat -aon | findstr "8080"右键添加需要了解的列表查看8080端口占用的pid比如占用端口的服务是VMware NAT Servic。 在服务管理器(services.msc)中停止VMware NA…

[米联客-安路飞龙DR1-FPSOC] FPGA基础篇连载-20 读写I2C接口的RTC时钟芯片

软件版本:Anlogic -TD5.9.1-DR1_ES1.1 操作系统:WIN10 64bit 硬件平台:适用安路(Anlogic)FPGA 实验平台:米联客-MLK-L1-CZ06-DR1M90G开发板 板卡获取平台:https://milianke.tmall.com/ 登录"米联客"FPGA社区 http://www.uisrc.com 视频课程、答疑解惑! 1概述 …