(单细胞下游分析——不同类型的数据读入,与部分数据类型的转化)
.h5ad(anndata 数据格式)
10x_mtx(cell ranger输出,三个文件)
就是cell ranger上游比对分析产生的3个文件:
├── xxx_feature_bc_matrix
│ ├── barcodes.tsv.gz:细胞标签(barcode)
│ ├── features.tsv.gz:基因ID(feature)
│ └── matrix.mtx.gz:表达数据(matrix)
一般先使用read10X()对这三个文件进行整合,得到行为基因、列为细胞的表达矩阵(为稀疏矩阵dgCMatrix格式,节约内存);然后再配合CreateSeuratObject()函数创建Seurat对象
counts.matrix.tsv.gz(一个文件)
counts.matrix.tsv.gz格式的文件里面包含了转成10x_mtx 格式的所有信息:
- 第一行是条形码(基因序列)(barcodes.tsv.gz)
- 第一列是基因(features.tsv.gz)
- 其余就是0/1矩阵(reads 计数)(matrix.mtx.gz)