文章发表 | 求臻医学发布精准肿瘤学临床试验预筛选平台

caf621fa7a1dcb4338b596a2d7d732f1.jpeg

近日,求臻医学信息与人工智能团队研发的精准肿瘤学临床试验预筛选平台OncoCTMiner,在线发表于国际期刊Database: The Journal of Biological Databases and Curation (IF=5.8)。OncoCTMiner集成自然语言处理(NLP)和大型语言模型(LLM)等人工智能技术,通过挖掘46万余条临床试验数据,构建了一个全面的精准肿瘤学入排条件数据库,助力肿瘤患者精准筛选可入组的临床试验。

e32f67cf77a82e830c06d67e4997c05c.jpeg


研究背景

随着对肿瘤患者肿瘤分子特征的不断深入研究,分子肿瘤学已经成为癌症治疗不可或缺的组成部分。这一研究方向有助于确定新的治疗靶点,推动精准医学治疗的广泛应用。基于遗传标记的个体化癌症治疗可以提高治疗反应率并延长无进展生存期。然而,尽管许多靶向治疗和免疫治疗处于临床试验阶段,但为了更好地推进癌症治疗,需要更多的参与者加入。虽然基因组分析的力度在不断增加,但令人遗憾的是,仅有约8%的癌症患者有机会参与临床试验。这主要是因为医生缺乏对可接受研究的了解,同时也受制于患者的状态、态度和经济状况等多重因素。


此外,将患者的基因数据与精准肿瘤学试验的入排条件相匹配也是一个挑战。在没有复杂试验匹配系统的情况下,医生必须手动浏览数百个不断更新的临床试验,以找到适合特定患者的临床实验。即使在顶级的癌症中心,肿瘤学家也会对他们的遗传专业知识表示质疑。


因此,为了解决患者-临床试验匹配的问题,我们自主研发了精准肿瘤学临床试验预筛选平台OncoCTMiner(图1),以期帮助肿瘤患者和临床医生快速高效地筛选潜在合适的临床试验,加速精准肿瘤学临床试验的进展,为患者带来新的希望。

1461a593d562d0e48234234ae86adffc.jpeg

图1. OncoCTMiner平台整体概览


研究设计

1)通过下载并解析ClinicalTrials.gov网站注册的临床试验,将其转化为便于后续NLP处理的BioC-JSON格式(图2)。全部过程利用脚本进行自动化处理,便于定期对数据库进行更新。

222c1e33395bbcda6bb4b15a20a0dcc5.jpeg

图2. OncoCTMiner 模块


2)将全部已解析的数据导入基于OncoPubMiner系统升级开发而来的临床试验数据标注平台OncoCTMiner(TaggingModule),经由生物医学专家对其中预筛选出来的与肿瘤精准诊疗相关的临床试验进行实体标注(图3)。多重审核后,构成了标准数据集,用于后续NLP模型的训练。

377cb9c2f8a8ac1e29d2a6e6a29a0a2c.jpeg

图3. OncoCTMiner临床试验数据标注与审核平台


3)基于标准数据集进行NLP模型训练,用于识别全部临床试验中涉及的各类生物医学实体(疾病/癌症、基因、变异、药物、生物标志物、治疗方案),及其所属的入排条件(NA<未知>、NC<非入排条件>、IN<入组条件>、EX<排除条件>)。


4)基于训练的实体识别及入排条件分类模型,对余下的临床试验进行自动化挖掘。通过挖掘结果构建数量庞大的精准肿瘤学临床试验入排条件数据库OncoCTMiner-DB。同时,提供检索功能丰富且界面友好的试验搜索引擎。


5)开发多组学变异注释流程OncoCTMiner-Anno,可以对VCF、Excel或文本格式的变异数据进行自动化分析注释。结合用户提供的临床诊断信息,一键式生成临床试验匹配报告,方便患者快捷、精准地匹配潜在合适的临床试验(图4)。

0d6a417736d40fe984ce4748b6a97591.jpeg

图4. OncoCTMiner临床试验匹配策略


研究结果

1.数据库

OncoCTMiner-DB数据库当前收录临床试验472,493条(数据库持续更新中,该数据为截至发稿时的数据,下同),128,976条为肿瘤相关临床试验,其中2,256条经过生物医学专家标注和多重审核。从这些临床试验中,识别出6大类共计8,152,420个生物医学实体,以及9,326,762对“实体-入排条件-临床试验”三元组(图5)。

de954d3276d5144f8980806b5cc67171.jpeg

图5. OncoCTMiner部分数据统计


2.搜索引擎

OncoCTMiner提供了功能丰富的精准肿瘤学临床试验搜索引擎,支持通过试验ID、癌种/疾病、基因、变异、药物、生物标志物(TMB、MSI等)、治疗方案等进行快速检索,并可以通过临床试验各种元数据(分期、性别、年龄、国别等)进行过滤。更重要的是,该搜索引擎支持通过实体所属的入排标准(入组条件/排除条件)进行精准搜索,这有助于过滤掉大量假阳性搜索结果,帮助用户快速筛选到符合条件的临床试验(图6)。

727c91f34df1cc70e6dff8c26013d404.jpeg

图6. OncoPubMiner临床试验搜索引擎


3.患者-试验匹配平台

b1971f882a1f8c9d7963b6eb8032165d.jpeg

图7. 患者-试验匹配功能及匹配报告


在患者-试验匹配(临床试验预筛选)任务提交页面,用户可以上传VCF格式变异(或者注释好的变异检测结果),选择癌种类型,设定各种有助于缩小筛选范围的参数(可选)后,即可提交注释任务。系统将在合理地时间内返回匹配结果报告。如果返回结果过多,用户还可利用试验过滤功能对结果列表进行过滤,直到得到最合适的试验匹配结果(更详细信息,可阅读OncoCTMiner论文,或者访问OncoCTMiner官网)。


研究总结

在本项目中,求臻医学成功研发了一套精准肿瘤学临床试验预筛选平台——OncoCTMiner。通过综合运用人工智能技术以及人工标注与审核,我们对超过46万条临床试验数据进行了深入挖掘,构建了一套全面的精准肿瘤学临床试验入排条件数据库。


基于这一创新平台,求臻医学实现了患者招募业务的自动化匹配,能够为肿瘤患者提供快速而精准的临床试验匹配服务,推动潜在高效肿瘤治疗方法的研发,为更多癌症患者带来福音。


在具体的临床实验匹配过程中,借助OncoCTMiner自动化临床试验预筛选平台,助力药企完成患者靶点与临床试验的高效初步匹配后,求臻医学药企合作部专业团队将与患者进行深度沟通,提供个性化、专业化的临床试验服务,助力更多癌症患者从创新药物治疗中获益。


未来,OncoCTMiner将整合至求臻医学自动化报告解读系统ChosenSmartReport,同步对肿瘤患者基因检测结果进行自动化分析和临床试验匹配,为检测患者提供免费、高质量且精准的试验匹配服务,为肿瘤患者带来更便捷、全面的医疗体验。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/176213.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3类主流的车道检测AI模型

2014年的一天&#xff0c;我舒舒服服地躺在沙发上&#xff0c;看着我和加拿大朋友租的豪华滑雪别墅的篝火营地&#xff0c;突然&#xff0c;一个东西出现在我的视野里&#xff1a; “着火了&#xff01;着火了&#xff01;着火了&#xff01;” 我大喊。 几秒钟之内&#xff…

基于51单片机电子钟温度计数码显示设计( proteus仿真+程序+设计报告+讲解视频)

这里写目录标题 ✅1.主要功能&#xff1a;✅讲解视频&#xff1a;✅2.仿真设计✅3. 程序代码✅4. 设计报告✅5. 设计资料内容清单&&下载链接✅[资料下载链接&#xff1a;](https://docs.qq.com/doc/DS0Nja3BaQmVtWUpZ) 基于51单片机电子钟温度检测数码显示设计( proteu…

尝试使用php给pdf添加水印

在开发中增加pdf水印的功能是很常见的&#xff0c;经过实验发现这中间还是会有很多问题的。第一种模式&#xff0c;采用生成图片的方式把需要添加的内容保存成图片&#xff0c;再将图片加到pdf中间&#xff0c;这种方法略麻烦一些&#xff0c;不过可以解决中文乱码的问题&#…

Payshield 10K是什么意思?有什么作用?

PayShield 10K是一种支付安全产品&#xff0c;由数字货币和法币混合而成的数字货币产品。它的意思是保护商家在交易过程中可能遭受的损失。这种产品的主要作用是保护数字货币支付系统的安全&#xff0c;并确保商家在交易过程中获得他们应得的收益。 PayShield 10K具有以下特点和…

《网络协议》07. 其他协议

title: 《网络协议》07. 其他协议 date: 2022-10-07 18:24:02 updated: 2023-11-15 08:00:52 categories: 学习记录&#xff1a;网络协议 excerpt: IPv6、WebSocket、WebService&#xff08;SOAP&#xff0c;WSDL&#xff09;、HTTPDNS、FTP、邮件&#xff08;SMTP&#xff0c;…

【KCC@南京】KCC南京数字经济-开源行

一场数字经济与开源的视听盛宴&#xff0c;即将于11月26日&#xff0c;在南京举办。本次参与活动的有&#xff1a; 庄表伟&#xff08;开源社理事执行长、天工开物开源基金会执行副秘书长&#xff09;、林旅强Richard&#xff08;开源社联合创始人、前华为开源专家&#xff09;…

Clickhouse学习笔记(3)—— Clickhouse表引擎

前言&#xff1a; 有关Clickhouse的前置知识详见&#xff1a; 1.ClickHouse的安装启动_clickhouse后台启动_THE WHY的博客-CSDN博客 2.ClickHouse目录结构_clickhouse 目录结构-CSDN博客 Cickhouse创建表时必须指定表引擎 表引擎&#xff08;即表的类型&#xff09;决定了&…

基于springboot实现学生选课平台管理系统项目【项目源码】

系统开发平台 在该地方废物回收机构管理系统中&#xff0c;Eclipse能给用户提供更多的方便&#xff0c;其特点一是方便学习&#xff0c;方便快捷&#xff1b;二是有非常大的信息储存量&#xff0c;主要功能是用在对数据库中查询和编程。其功能有比较灵活的数据应用&#xff0c…

Live800:客服行业的发展历程及未来前景

随着信息技术和互联网的高速发展&#xff0c;客服行业也在不断变革和发展。客服行业是一个服务型的行业&#xff0c;其发展历程也与人们对服务需求的变化密切相关。本文将介绍客服行业的发展历程和未来前景。 客服行业的发展历程 20世纪70年代&#xff0c;客服行业主要以电话服…

基于springboot实现校园医疗保险管理系统【项目源码】计算机毕业设计

基于springboot实现校园医疗保险管理系统演示 系统开发平台 在线校园医疗保险系统中&#xff0c;Eclipse能给用户提供更多的方便&#xff0c;其特点一是方便学习&#xff0c;方便快捷&#xff1b;二是有非常大的信息储存量&#xff0c;主要功能是用在对数据库中查询和编程。其…

Java的XWPFTemplate word生成列表

Java的XWPFTemplate工具类导出word.docx的使用_xwpftemplate 语法_youmdt的博客-CSDN博客 如果是表格的列表参考上面这篇文章即可&#xff0c;比较复杂的列表遍历暂时还没找到方法&#xff0c;只能手动创建表格了 上面是模板&#xff0c;非常简单&#xff0c;以为我们是要自己创…

【信息安全原理】——传输层安全(学习笔记)

&#x1f4d6; 前言&#xff1a;为保证网络应用&#xff0c;特别是应用广泛的Web应用数据传输的安全性&#xff08;机密性、完整性和真实性&#xff09;&#xff0c;可以在多个网络层次上采取安全措施。本篇主要介绍传输层提供应用数据安全传输服务的协议&#xff0c;包括&…