代码+视频,R言语处理数据中的缺失值

在SCI论文中,我们不可避免和缺失数据打交道,特别是在回顾性研究,对于缺失的协变量(就是混杂因素),我们可以使用插补补齐数据,但是对于结局变量和原因变量的缺失,我们不能这么做。部分人的做法是直接删除掉这部分的数据(如SEER数据库),有些高分SCI杂志的审稿人会问你缺失数据的情况和你是怎么处理的,如果我们能附上一个缺失数据和未缺失数据比较的表格,可以起到一表抵千言万语的作用,如下图。

在这里插入图片描述
如表格所示,如果比较出缺失数据和未缺失数据P值大于0.05,说明数据为随机缺失,删除后对数据分布没有影响,但如果小于0.05,你删除这部分数据则要说明删除原因。

今天咱们视频演示一下如何R语言做出上面的表格

R言语处理数据中的缺失值

代码

library(foreign)
library("survival")
library(tidyverse)
library(compareGroups)
bc<-read.spss("E:/r/test/Breast cancer survival agec.sav",use.value.labels=F, to.data.frame=T)
head(bc,10)# age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,
# er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),
# ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。#假设我们想知道er表示雌激素受体状态和结局死亡的关系,我们看到er还是有很多缺失值的,我们先要把这部分缺失值提出来bc1<-bc%>%mutate(cancelled=is.na(er))bc1$cancelled<-ifelse(bc1$cancelled=="TRUE",1,0)##分类变量转成因子
bc1$lnpos <- factor(bc1$lnpos)
bc1$histgrad <- factor(bc1$histgrad)
bc1$pr <- factor(bc1$pr)
bc1$status<- factor(bc1$status)
bc1$pathscat<- factor(bc1$pathscat)
bc1$ln_yesno<- factor(bc1$ln_yesno)
bc1$cancelled<-factor(bc1$cancelled)###生成表格
descrTable(cancelled~ .-er, data = bc1)  ##要减掉er这个变量# status:                             0.927   
# 0     818 (94.1%) 317 (93.8%)           
# 1     51 (5.87%)  21 (6.21%)    #换个方式
descrTable(status~cancelled, data = bc1)# cancelled:                          0.927   
# 0      818 (72.1%) 51 (70.8%)           
# 1      317 (27.9%) 21 (29.2%)  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/691024.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VC++ 6.0开发文件重复整理工具开发

开发背景&#xff1a;手机上的文件越来越多&#xff0c;想要备份下文件结果文件太多杂乱无章且重复文件冗余存储造成存储空间滥发&#xff0c;所以决定开发一个小工具来整理重复文件。由于本人电脑运行慢&#xff0c;选择VC6.0作为开发IDE&#xff0c;操作虽然麻烦点&#xff0…

【FPGA/数字IC】Multiport RAM,多读多写寄存器-——基于FPGA BRAM的多端口地址查找表与FPGA BRAM的资源分析

目录 背景 手写Multiport Ram Multiport RAM 代码方案 资源评估 Multiport RAM 资源利用的优化 资源评估 防止读写冲突的组合逻辑设计&#xff08;写优先&#xff09; 仿真和时序 单口写数据 单端口读数据 多口读相同数据 多口同时读不同数据 背景 在多端口交换机的…

商务英语口语成人考级外语培训之BECkao考级口语篇

在口语考试中&#xff0c;不管实际内容你能说出多少&#xff0c;但准备一些套话&#xff0c;至少还能撑撑场子你们说是不是&#xff1f; 内容阐述 描述事实 1.Im going to describe/present/explain/give you some information about... 2.Id like to say a few words about...…

探索全画面塑料焊接透光率检测仪的科技魅力

在精密工业和科研领域中&#xff0c;对材料的光学性能有着严格的要求。全画面塑料焊接透光率检测仪是一种先进的设备&#xff0c;它能够精确测量塑料焊接接头的透光率&#xff0c;确保焊接质量符合高标准。本文将详细介绍这一设备的特点、工作原理以及它在实际应用中的重要性。…

简易留言板

目录 前端实现 数据库的使用 创建数据表 创建项目 连接数据库 后端实现 接口定义 持久层 业务逻辑层 控制层 前端代码完善 留言板是一个常见的功能&#xff0c;在本篇文章中&#xff0c;将实现一个简易的留言板&#xff1a; 页面中能够显示所有留言内容&#xff0c…

C++类和对象(5)static修饰的静态成员变量函数

1.静态成员函数和静态成员变量的引入 &#xff08;1&#xff09;我们通过以下面的这个例子逐步引出静态的成员变量和成员函数&#xff1a; 我们自己定义一个类&#xff0c;使用这个类创建对象&#xff0c;我们应该如何判断在这个程序执行的过程中&#xff0c;创建了多少个对象…

深度解析Nginx:高性能Web服务器的奥秘(上)

&#x1f407;明明跟你说过&#xff1a;个人主页 &#x1f3c5;个人专栏&#xff1a;《洞察之眼&#xff1a;ELK监控与可视化》&#x1f3c5; &#x1f516;行路有良友&#xff0c;便是天堂&#x1f516; 目录 一、前言 1、Nginx概述 2、Nginx的历史与发展 3、Nginx的…

软件全套资料梳理(需求、开发、实施、运维、安全、测试、交付、认证、评审、投标等)

软件全套精华资料包清单部分文件列表&#xff1a; 工作安排任务书&#xff0c;可行性分析报告&#xff0c;立项申请审批表&#xff0c;产品需求规格说明书&#xff0c;需求调研计划&#xff0c;用户需求调查单&#xff0c;用户需求说明书&#xff0c;概要设计说明书&#xff0c…

根据docker部署nginx并且实现https

目录 一、Docker中启用HTTPS有几个重要的原因 二、https介绍 三、https过程 四、安装docker-20.10.18 五、如何获取证书 通过阿里云获取证书 六、docker部署nginx并且实现https 6.1准备证书 6.2准备nginx.conf 和 index.html文件 6.3生成容器 6.4浏览器验证证书 一、…

2024年4月24日华为春招实习试题【三题】-题目+题解+在线评测,2024.4.24,华为机试

2024年4月24日华为春招实习试题【三题】-题目题解在线评测&#xff0c;2024.4.24&#xff0c;华为机试 &#x1f3e9;题目一描述&#xff1a;输入格式输出格式样例1样例2样例3数据范围解题思路一&#xff1a;dfs解题思路二&#xff1a;直接二分查找哇&#xff01;解题思路三&am…

MySQL数据库的初始化(创建库、创建表、向数据库添加测试数据)

MySQL数据库的初始化&#xff08;创建库、创建表、向数据库添加测试数据&#xff09; MySQL数据库简介MySQL创建一个新的数据库MySQL创建一张新的数据表简单&#xff08;设置&#xff09;表复杂&#xff08;设置&#xff09;表 填充测试数据SQL语句mysql>模式下输入的每句sq…

技术爱好者必看:如何用AI问答API彻底改变用户体验!

AI 问答 API 对接说明 我们知道&#xff0c;市面上一些问答 API 的对接还是相对没那么容易的&#xff0c;比如说 OpenAI 的 Chat Completions API&#xff0c;它有一个 messages 字段&#xff0c;如果要完成连续对话&#xff0c;需要我们把所有的上下文历史全部传递&#xff0…