R的seurat和python的scanpy对比学习

现在的单细胞分析,往往避免不了scanpy的使用,我们可以通过对比seurat来学习scanpy

今天的格式怎么都改不了。。。手机阅读有点费劲,,推荐电脑阅读。

单细胞数据分析概览

单细胞分析,总流程


python教程

 

seurat教程

seurat中与scanpy对等的函数操作

数据预处理

Seurat (R)

CreateSeuratObject(): 创建Seurat对象。

NormalizeData(): 数据标准化。

FindVariableFeatures(): 识别高变异基因。

ScaleData(): 数据缩放和中心化。

Scanpy (Python)

sc.read() / sc.read_10x_mtx(): 读取数据创建AnnData对象。

sc.pp.normalize_total(): 数据标准化。

sc.pp.highly_variable_genes(): 识别高变异基因。

sc.pp.scale(): 数据缩放和中心化。


降维分析

Seurat (R)

RunPCA(): 主成分分析(PCA)。

RunUMAP(): UMAP降维。

RunTSNE(): t-SNE降维。

Scanpy (Python)

sc.tl.pca(): 主成分分析(PCA)。

sc.tl.umap(): UMAP降维。

sc.tl.tsne(): t-SNE降维。


聚类分析

Seurat (R)

FindNeighbors(): 计算邻居图。

FindClusters(): 基于图的聚类。

Scanpy (Python)

sc.pp.neighbors(): 计算邻居图。

sc.tl.louvain() / sc.tl.leiden(): 基于图的聚类。


差异表达分析

Seurat (R)

FindMarkers(): 寻找差异表达基因。

Scanpy (Python)

sc.tl.rank_genes_groups(): 寻找差异表达基因。


数据可视化

Seurat (R)

DimPlot(): 降维数据可视化。

FeaturePlot(): 基因表达水平可视化。

VlnPlot(): 小提琴图展示基因表达分布。

Scanpy (Python)

sc.pl.umap() / sc.pl.tsne(): 降维数据可视化。

sc.pl.dotplot() / sc.pl.violin(): 基因表达水平可视化。

为何seurat中没有与scanpy中的sc.pp.log1p(adata)对应步骤

有几个方面考虑:

1. 数据标准化方法的差异

Seurat和Scanpy在数据预处理和标准化方面采取了不同的方法。Seurat的NormalizeData函数默认使用的是LogNormalize方法,这个方法首先对每个细胞的基因表达量进行归一化处理,使得每个细胞的总表达量相同(默认是1e4),然后对归一化后的表达量加1后取对数(使用自然对数)。这个过程实质上包含了与Scanpy中sc.pp.normalize_total后跟sc.pp.log1p相似的步骤,只是Seurat将其整合在了一个步骤中进行。

2. 集成的处理流程

Seurat的设计哲学是提供一个相对简化和集成的分析流程,使得用户可以通过少量的函数调用完成从数据预处理到高级分析的整个过程。因此,Seurat在其标准化函数中内置了对数变换,而无需用户手动进行这一步。这种设计选择简化了分析流程,减少了需要记住的函数数量,但也意味着用户在使用过程中可能对于数据处理的每一步不如Scanpy那样清晰明了。

3. 灵活性与透明度

Scanpy采取的是更模块化的策略,每个处理步骤都由不同的函数完成。这种方法提供了更大的灵活性和透明度,使得用户能够更清楚地看到数据是如何被逐步处理和分析的。这对于需要定制处理流程的研究人员来说是一个优点。

看完记得顺手点个“在看”哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/486773.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

H5获取手机相机或相册图片两种方式-Android通过webview传递多张照片给H5

需求目的: 手机机通过webView展示H5网页,在特殊场景下,需要使用相机拍照或者从相册获取照片,上传后台。 完整流程效果: 如下图 一、H5界面样例代码 使用html文件格式,文件直接打开就可以展示布局&#…

大模型平民化技术之LORA

1. 引言 在这篇博文中, 我将向大家介绍LoRA技术背后的核心原理以及相应的代码实现。 LoRA 是 Low-Rank Adaptation 或 Low-Rank Adaptors 的首字母缩写词,它提供了一种高效且轻量级的方法,用于微调预先训练好的的大语言模型。这包括 BERT 和…

2024年面试季,大前端相关开发者不妨了解一下鸿蒙开发岗

搜狐:我宣布与华为达成鸿蒙全面合作! 美团:我宣布与华为达成鸿蒙全面合作! 360 :我宣布与华为达成鸿蒙全面合作! 高德:我宣布与华为达成鸿蒙全面合作! 新浪:我宣布与华为…

HubSpot出海营销的优势有哪些?

HubSpot在出海营销方面的优势可以更为详细地分析如下: 全球化功能支持: HubSpot的多语言支持和多地区适配功能,使得企业能够在不同国家和地区进行营销活动,而不必担心语言和文化差异的障碍。 通过全球化的模板和内容管理系统&a…

导入excel某些数值是0

目录 导入excel某些数值是0数据全部都是0原因解决 部分数据是0原因解决 导入excel某些数值是0 数据全部都是0 有一列“工单本月入库重量”全部的数据都是0 原因 展示的时候,展示的字段和内表需要展示的字段不一致,导致显示的是0。 解决 修改展示的字…

静态时序分析:SDC约束命令set_driving_cell详解

相关阅读 静态时序分析https://blog.csdn.net/weixin_45791458/category_12567571.html?spm1001.2014.3001.5482 在上文中,我们不建议使用set_drive命令而是使用set_driving_cell命令,这是一个描述输入端口驱动能力更精确的方法。因为大多数情况下&…

Unicode转换 [ASIS 2019]Unicorn shop1

打开题目 点击进去之后是一个购买独角兽的界面,有四种类型的独角兽,前三种的价格比较便宜,最后的独角兽价格比较贵。 我们先尝试购买前三种独角兽,输入id,然后price输入9 我们直接查看源代码 可以看到在charset"…

代理模式笔记

代理模式 代理模式代理模式的应用场景先理解什么是代理,再理解动静态举例举例所用代码 动静态的区别静态代理动态代理 动态代理的优点代理模式与装饰者模式的区别 代理模式 代理模式在设计模式中是7种结构型模式中的一种,而代理模式有分动态代理&#x…

LabVIEW高效核磁测井仪器多线程优化

LabVIEW高效核磁测井仪器多线程优化 为提高核磁测井仪器的测试效率与性能,开发了基于LabVIEW的多线程优化模型。该研究针对传统的核磁测井仪器软件,在多任务调度测试和并行技术需求上存在的效率不高和资源利用率低的问题,提出了一个多线程优…

《教育教学论坛》期刊是什么级别?是核心期刊吗?是C刊吗?

​标题解答 问:《教育教学论坛》版面费? 答:VX:JDQJDQ444 问:《教育教学论坛》是核心期刊吗? 答:不是核心期刊 问:《教育教学论坛》是正规期刊吗? 答:是正规期刊 …

SIP 会话发起协议

目录 会话发起协议 SIP SIP 系统的构件 SIP 的地址 SIP 特点 一个简单的 SIP 会话 会话描述协议 SDP 会话发起协议 SIP H.323 过于复杂,不便于发展基于 IP 的新业务。 会话发起协议 SIP (Session Initiation Protocol) 是一套较为简单且实用的标准&#xff0…

Linux调试器——gdb的基础使用

目录 1.背景 2.指令的使用 2.1gdb的使用和退出 2.2显示源代码 2.3运行程序 2.4调试 1.打断点 2.查断点 3.去断点 4.运行 5.关闭断点 6.启用断点 7.逐过程 8.进入函数 9.显示变量的值 1.背景 众所周知,我们的程序发布有两种,分别是debug模式和release模式…