生存分析survival_analysis_COXmodel_python实现

什么是生存分析?

生存分析(在工程中也称为可靠性分析)的目标是建立协变量与事件发生时间之间的联系。该算法起源于临床医学研究,往往主要目标是预测死亡时间,即生存。生存分析是一种回归问题(人们想要预测一个连续的值),它与传统回归的不同之处在于,部分训练数据只能被部分观察到(它们被删减了)。

例如:
考虑一项临床研究,该研究调查了冠心病,时间跨度为1年。如图所示。
在这里插入图片描述

患者A在3个月后失去随访,无心血管事件记录,患者B在入组4个半月后发生事件,患者D在入组2个月后退出研究,患者E在研究结束前未发生任何事件。因此,只能记录患者B和C的心血管事件的确切时间,他们的记录是未删失的。对于剩余的患者,不知道他们是否在研究结束后是否发生了事件,因此他们的信息是删失的。

形式上,每个患者记录由一组协变量组成 x ∈ R d x \in \mathbb{R}^d xRd,以及时间 t > 0 t>0 t>0事件发生的时间或时间 c > 0 c>0 c>0删失。由于删失、经历和事件是相互排斥的,所以通常定义一个事件指示器 δ ∈ { 0 ; 1 } \delta \in \{0;1\} δ{0;1}以及可观察到的生存时间 y > 0 y>0 y>0。右删失样本可观测时间 y y y的定义为
y = m i n ( t , c ) = { t if  δ = 1 c if  δ = 0 y=min(t,c)=\begin{cases} t& \text{ if } \delta =1 \\ c& \text{ if } \delta =0 \end{cases} y=min(t,c)={tc if δ=1 if δ=0
因此,生存分析是一种需要考虑到这种数据集的独特特征的算法。

生存分析的研究对象为生存时间,即事件失败所发生的时间,比如研究病人感染某种病毒之后多长时间会死亡,也可以是借款者在完成借款后多长时间会发生违约事件。

生存分析中的预测通常侧重与预测一个函数,而不是专注于预测时间上发生的事件,要么是生存函数,要么是风险函数。

生存函数 S ( t ) = P ( T > t ) S(t)=P(T>t) S(t)=P(T>t)返回超过时间 t t t的生存概率,风险函数 h ( t ) h(t) h(t)表示事件在小时间间隔 [ t ; t + △ t ] [t; t+\triangle t] [t;t+t]内事件发生的近似概率(没有上界),条件是个体在时间 t t t时没有发生事件:
h ( t ) = lim ⁡ △ t → 0 P ( t ≤ T < t + △ t ∣ T ≥ t ) △ t ≥ 0 h(t)=\lim_{\triangle t \to 0} \frac{P(t\le T < {t+\triangle t}|T \ge t)}{\triangle t} \ge 0 h(t)=t0limtP(tT<t+tTt)0

风险函数的其他名称有条件失败率、条件死亡率或瞬时失败率。与描述事件未发生的生存函数不同,风险函数提供了关于事件发生的信息。累计风险函数 H ( t ) H(t) H(t)为时间段 [ 0 ; t ] [0;t] [0;t]内风险函数的积分:
H ( t ) = ∫ 0 t h ( u ) d u H(t)=\int_0^t h(u)du H(t)=0th(u)du

预测

给定观察数据 { ( y 1 , δ 1 ) , . . . , ( y n , δ n ) } \{(y_1,\delta_1),...,(y_n,\delta_n)\} {(y1,δ1),...,(yn,δn)},生存函数 S ( t ) S(t) S(t) H ( t ) H(t) H(t)可以分别通过sksurv.nonparametric.kaplan_meier_estimator()sksurv.nonparametric.nelson_aalen_estimator()估计。

上述估计过于简单,因为没有考虑到可能影响生存的其他特征。 C O X COX COX比例风险模型(sksurv.linear_model.CoxPHSurvivalAnalysis)提供了一种在存在额外协变量情况下估计生存和累计风险函数的方法,它假设存在基线风险函数,并且协变量仅按比例改变风险。也就是说,它假设两个病人经历一个事件的风险比率随时间保持不变。生存函数 S ( t ) S(t) S(t) H ( t ) H(t) H(t)可以分别通过sksurv.linear_model.CoxPHSurvivalAnalysis.predict_survival_function()sksurv.linear_model.CoxPHSurvivalAnalysis.predict_cumulative_hazard_function()估计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/314645.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何让GPT成为你的科研助手?

如何让GPT成为你的科研助手&#xff1f; 一OpenAI 1.最新大模型GPT-4 Turbo2.最新发布的高级数据分析&#xff0c;AI画图&#xff0c;图像识别&#xff0c;文档API 3.GPT Store 4.从0到1创建自己的GPT应用 5. 模型Gemini以及大模型Claude2二定制自己的GPTs 1.自定义GPTs使…

深度学习中氨基酸序列的编码方法

目录 1. 常规特征编码方法1.1 类别特征1.2 文本特征 2. 基于领域先验知识的编码方法2.1 演化关系2.2 理化性质 3. 基于学习的编码方法3.1 预训练模型3.2 端到端方法 参考 随着AI算法创新和算力提升&#xff0c;叠加生物&#xff08;组学&#xff09;数据&#xff08;指数级&…

C语言注意点(1)

1、switch&#xff0c;case&#xff0c;break&#xff0c;default相关注意点 当变量表达式的内容与某个case后的常量相等后&#xff0c;就执行该case下的语句&#xff0c;break表示该case以后的内容不会执行(立即跳出switch语句)&#xff0c; 如果没有跟break&#xff0c;会继续…

C++正则表达式全攻略:从基础到高级应用

C正则表达式全攻略&#xff1a;从基础到高级应用 一、基础知识二、正则表达式的基本匹配三、C中使用正则表达式四、高级正则表达式五、实践示例六、性能优化6.1、编译正则表达式6.2、避免过度使用回溯6.3、优化匹配算法 七、总结 一、基础知识 正则表达式是一种用于匹配、搜索…

国标GB28181对接的时候如何配置服务端口和本地端口

目 录 一、国标GB28181对接需要配置的端口等参数 二、GB28181服务器端口的配置&#xff1a;SIP服务器端口 三、GB28181设备测端口的配置&#xff1a;本地SIP端口 &#xff08;一&#xff09;本地SIP端口配置的意义 &#xff08;二&#xf…

<软考高项备考>《论文专题 - 42 范围管理(1) 》

1 范围管理基础 1.1 写作要点 过程定义、作用写作要点、思路规划范围管理规划范围管理是为了记录如何定义、确认和控制项目范围及产品范围&#xff0c;而创建范围管理计划的过程。作用:在整个项目期间对如何管理范围提供指南和方向。写范围管理计划、需求管理计划的内容;编写…

翼辉 SylixOS 正式支持“申威“处理器架构

近日&#xff0c;翼辉信息发布了最新的 SylixOS V3.4.0 操作系统。在 SylixOS V3.4.0 中&#xff0c;已正式加入了对申威 SW64 自主指令集架构的支持。 SW64 自主指令集架构是我国在处理器领域的一项重要突破&#xff0c;其知识产权完全可控、自主性高、安全性强&#xff0c;核…

深度学习|10.2 边缘检测示例 10.3 更多边缘检测

文章目录 如何在编程中实现卷积运算使用卷积实现边缘检测结果矩阵的元素正负性质的意义水平分类器如何构造卷积运算使用的矩阵 原矩阵通过一个过滤器&#xff08;filter&#xff09;/核心&#xff08;kernel&#xff09;来生成一个新的矩阵。 如何在编程中实现卷积运算 使用卷积…

blender mix节点和它的混合模式

Mix 节点是一种用于混合两个颜色或者两个图像的节点&#xff0c;它有以下几个输入和输出&#xff1a; Color1&#xff1a;用于接收第一个颜色或者图像&#xff0c;也就是基色。Color2&#xff1a;用于接收第二个颜色或者图像&#xff0c;也就是混合色。Fac&#xff1a;用于控制…

Django 实现Web便签

效果图 会用到的知识 目录结构与URL路由注册request与response对象模板基础与模板继承ORM查询后台管理 实现步骤 1. terminal 输入 django-admin startapp the_10回车 2. 注册&#xff0c; 在 tutorial子文件夹settings.py INSTALLED_APPS 中括号添加 "the_10" IN…

病情聊天机器人,利用Neo4j图数据库和Elasticsearch全文搜索引擎相结合

项目设计目的&#xff1a; 本项目旨在开发一个病情聊天机器人&#xff0c;利用Neo4j图数据库和Elasticsearch全文搜索引擎相结合&#xff0c;实现对病情相关数据的存储、查询和自动回答。通过与用户的交互&#xff0c;机器人可以根据用户提供的症状描述&#xff0c;给出初步的可…

Web前端第9章思维导图

本章内容是关于CSS样式属性&#xff0c;包含CSS单位、CSS字体样式、CSS文本样式、CSS颜色与背景、CSS列表样式、CSS盒模型。重点在于CSS盒模型、CSS文本样式、CSS字体样式。 1. CSS单位 绝对单位 磅&#xff08;pt&#xff09;&#xff0c;pica&#xff08;pc&#xff09;、c…