CancerSubtypes包(多种肿瘤分型方法)

CancerSubtypes: an R/Bioconductor package for molecular cancer subtype identification, validation and visualization 

介绍

该包是2017年发表的已经很久了,但其涵盖的几种分型方法比较经典。

开发背景:cancer subtype R包,该包使用相同的输入和输出格式实现了众所周知的癌症亚型发现方法。

内含方法:

  • Consensus clustering (CC) (Monti et al., 2003) is an unsupervised clustering method, which is frequently used and has several successful applications in cancer subtype discovery.

  • Consensus non-negative matrix factorization (CNMF) (Brunet et al., 2004) is an effective dimension reduction method used for finding molecular patterns from high-dimensional datasets.

  • Integrative clustering (iCluster) (Shen et al., 2009) uses a joint latent variable model for iCluster of multi-omics data.

  • Similarity network fusion (SNF) (Wang et al., 2014) is a method using SNF for aggregating multi-omics data to discover the similarities between patients.

  • We propose a new method, SNF-CC to combine SNF and CC together to take the advantages of both for cancer subtype identification.

  • Weighted SNF (WSNF) (Xu et al., 2016) is similar to SNF but it takes the level of importance of genes into consideration. The gene weights are calculated based on the number of links the genes have in the miRNA-Transcription Factor-mRNA regulatory network.


    提供的验证和可视化方法

生存分析,表达差异,轮廓系数等

  • Statistical significance of clustering (Liu et al., 2008) tests the significance of the difference in data distribution between subtypes.

  • Silhouette width (Rousseeuw, 1987) is used to measure how well a sample is matched to its identified subtype compared to other subtypes. A high Silhouette value indicates that the sample is well matched.


github及使用手册

taoshengxu/CancerSubtypes (github.com)

安装

devtools::install_github("taoshengxu/CancerSubtypes")

该文献补充文件提供了详细的使用代码bioinformatics_33_19_3131_s2.pdf (silverchair-cdn.com)

例如共识聚类:

 load("GBM_GeneEXp.rda")load("GBM_miRNA_8x15k.rda")load("GBM_clinical.rda")##The input dataset is multi-genomics data as a listGBM=list(GeneExp=GBM_GeneEXp,miRNAExp=GBM_miRNA_8x15k)result8 =ExecuteCC(clusterNum=3,d=GBM,maxK=3,clusterAlg="hc",distance="pearson",title="GBM")group=result8$groupdistanceMatrix=result8$distanceMatrixp_value=survAnalysis(mainTitle="GBM Consensus Clustering-Cluster=3",GBM_clinical$time,GBM_clinical$status,group,distanceMatrix=distanceMatrix,similarity=TRUE)##*****************************************************##GBM Consensus Clustering-Cluster=3 Cluster= 3 Call:##survdiff(formula = Surv(time, status) ~ group)##N Observed Expected (O-E)^2/E (O-E)^2/V##group=1 58##group=2 214##group=3 456161365.5152.02.51.37550.53200.09962.1121.8480.101##Chisq= 2.2 on 2 degrees of freedom, p= 0.339

参考文献:

1:CancerSubtypes: an R/Bioconductor package for molecular cancer subtype identification, validation and visualization

2:各种癌症都有自己的细分亚型 - 知乎 (zhihu.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/498225.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++初阶:0_前言

前言 一.什么是C C语言是结构化和模块化的语言,适合处理较小规模的程序。对于复杂的问题,规模较大的程序,需要高度的抽象和建模时,C语言则不合适。为了解决软件危机, 20世纪80年代, 计算机界提出了OOP(ob…

Pingora正式开源:超强的Nginx替代品,每秒可处理4000万请求!

2 月 28 日,Cloudflare 开源了其自研的 Nignx 替代品:Pingora。这是一个基于 Rust 打造的高速、可靠与可编程的网络系统。目前,Cloudflare 已使用 Pingora 全面替代 Nginx 。经过实战检验,Pingora 每秒稳定处理超过 4000 万的网络…

汇率都是受哪些因素影响?央行有哪些政策

汇率都是受哪些因素影响的呢?很多外汇交易员相信都会有这样的疑问,Anzo Capital昂首资本提醒各位交易员,其实外汇汇率变动会受到很多不同的因素,甚至有些因素是相反、自我矛盾的方向的因素的影响,而不仅仅是通货膨胀的…

c++ for 循环语句

循环语句 在C中,有几种循环语句可用于重复执行一段代码,直到满足指定条件为止,主要有 for 循环、while 循环、do-while 循环三种循环语句。三者区别: 循环类型特点for 循环1. 适用于已知循环次数的情况,循环次数事先…

高刷显示器 - HKC VG253KM

🔥🔥 今天来给大家揭秘一款电竞神器 - HKC VG253KM 高刷电竞显示器!这款显示器可是有着雄鹰展翅般的设计灵感,背后的大鹏展翅鹰翼图腾让人过目难忘。那么,这款显示器到底有哪些过人之处呢?一起来看看吧&…

Jupyter Notebook 下载+简单设置

这里写目录标题 1. Jupyter Notebook安装2.切换打开别的盘3. 创建代码文件4.为jupyter notebook添加目录 (Jupyter安装拓展nbextensions)step1:安装命令step2:用户配置step3:上述过程均完成后,打开jupyter notebook就会发现界面多…

ifcplusplus 示例 函数中英文 对照分析以及流程图

有需求,需要分析 ifc c渲染,分析完,有 230个函数,才能完成一个加载,3d加载真的是大工程! 示例代码流程图 函数中英文对照表,方便 日后开发,整理思路顺畅!!&am…

队列的概念及使用

目录 一. 概念 二. 队列的使用 三. 队列模拟实现 四. 循环队列 五. 面试题 一. 概念 队列 :只允许在一端进行插入数据操作,在另一端进行删除数据操作的特殊线性表,队列具有先进先出 FIFO(First In First Out) 入队列:进行插入操…

2.1_7 线程的状态与转换、组织与控制

2.1_7 线程的状态与转换、组织与控制 (一)线程的状态与转换 (二)线程的组织与控制

迅为新全国产龙芯3A6000主板支持Loongnix、国产麒麟、通信、翼辉等系统

龙芯 3A6000 处理器完全自主设计、性能优异,代表了我国自主桌面 CPU 设计领域的最新里程碑成果。龙芯 3A6000 处理器的推出,说明国产 CPU 在自主可控程度和产品性能上已双双达到新高度,也证明了国内有能力在自研 CPU 架构上做出一流的产品。 …

[pdf]软件方法上册第二版自测题答案和解析-共144页

潘加宇 软件方法(上)业务建模和需求 第二版 自测题答案和解析,pdf文件,和书配套使用 已上传至CSDN资源。 也可到百度网盘下载,网盘地址: https://pan.baidu.com/s/1wEPFkJE7RUYvNUFxzAkCeQ?pwdumlc 提…

[linux][xdp] xdp 入门

xdp 全称 eXpress Data Path,是 linux ebpf 中的一个功能。ebpf 在内核中预留了一些插入点,用户可以在这些插入点插入自己的处理逻辑,当数据路过插入点时可以做一些预期的处理,具体实现方式如下: ① 用户编写数据处理…