windows ubuntu 子系统:肿瘤全外篇,bam质控

各个环节的质控,
raw和clean都要质控,
比对的各环节的bam文件都要质控,
使用qulima对wes的比对bam文件总结测序深度及覆盖率。

samtools flagstat L1_recalibrated_reads.bam
该命令将输出 BAM 文件的一些统计信息,包括总读取数、比对上参考序列的读取数、比对到不同位置的读取数等。

#结果可如下。

L1_recalibrated_reads.bam 的统计信息如下:
总读取数:103,094,432
比对上参考序列的读取数:103,028,917 (占总读取数的 99.94%)
次要比对的 reads 数:0
补充比对的 reads 数:674,520
重复 reads 数:22,411,852
成对测序的 reads 数:102,419,912
测序的 read1 数:51,209,956
测序的 read2 数:51,209,956
正确成对匹配的 reads 数:101,697,064 (占成对测序的 reads 的 99.29%)
自身及其 mate 均比对到参考序列的 reads 数:102,306,392
单独出现的 reads 数:48,005 (占总读取数的 0.05%)
与不同染色体的 mate 均比对的 reads 数:400,816
映射到不同染色体且 mapQ 值大于等于 5 的 reads 数:304,376

运行以下命令可以计算 L1.bam 中的总行数(即记录数),从而得知该 BAM 文件中包含多少条比对信息:samtools view 949743-T_L2_1.bam | wc -l

#获取全外bed文件

CCDS官网
进入官网后进入其ftp服务器

cat CCDS.20221027.txt | perl -alne '{/\[(.*?)\]/;next unless $1;$gene=$F[2];$exons=$1;$exons=~s/\s//g;$exons=~s/-/\t/g;print "$F[0]\t$_\t$gene" foreach split/,/,$exons;}'|sort -u |bedtools sort -i |awk '{print "chr"$0"\t0\t+"}'  > hg38.exon.bed
这条命令的作用是将 CCDS(Consensus CDS)数据中的 exons 信息提取出来,生成一个 BED 文件 hg38.exon.bed。具体实现步骤如下:使用 cat 命令将 CCDS.20221027.txt 文件的内容输出到标准输出。
使用 perl 命令解析每一行,并通过正则表达式提取出 exons 信息。如果该行不包含 exons 信息,则跳过。
将提取到的 exons 信息进行格式化,并使用 split 函数将其拆分成多个 exon。对于每个 exon,输出其所在的染色体、起始位置、终止位置和所属基因。
使用 sort 命令将输出结果按照染色体、起始位置和终止位置排序。
使用 awk 命令将排序后的结果转换为 BED 格式,并指定其 score 和 strand 信息,最终将结果输出到 hg38.exon.bed 文件中。
这个 hg38.exon.bed 文件可以用于基因组注释和区域相关的分析。

samtools view L1_recalibrated_reads.bam | less -S
这条命令使用 samtools view 命令来查看 949743-T_L2_1_recalibrated_reads.bam 这个 BAM 文件的内容,并通过管道将输出传递给 less -S 命令进行分页查看。
samtools view 命令用于从 BAM 文件中读取比对信息,并以文本格式输出。| 符号表示将前一个命令的输出作为后一个命令的输入进行处理。
less 命令是一个分页查看器,可以按需滚动查看文件的内容。-S 参数用于禁用行内过长时的折行显示,保持每行内容在屏幕上的可见性。
因此,执行该命令后,将能够使用 less 分页查看 L1_recalibrated_reads.bam 文件中的比对信息。您可以使用方向键(上下左右)和 Page Up/Page Down 键来浏览文件内容,并使用 q 键退出 less 查看器。

# 1. 创建输出目录
mkdir -p qc_results

#安装qualimap

qualimap bamqc \
    -bam L1.bam \
    -outdir qc_results \
    -c \
    --java-mem-size=4G \
    --feature-file /mnt/h/db/hg38.bed/hg38.exon.bed \
    -nt 4

qualimap bamqc: 这是运行 Qualimap 工具中的 bamqc 模块的命令,用于评估 BAM 文件的质量。

-bam L1.bam-bam 参数指定输入的 BAM 文件,这里使用的是 949743-T_L2_1.bam 文件。

-outdir qc_results-outdir 参数指定输出结果的目录,这里结果将保存在名为 qc_results 的目录中。

-c-c 参数表示生成覆盖度报告。

--java-mem-size=4G--java-mem-size 参数指定分配给 Java 虚拟机的内存大小,这里设置为 4GB。

--feature-file /mnt/h/db/hg38.bed/hg38.exon.bed--feature-file 参数指定感兴趣的区域文件,这里使用的是一个 BED 格式的文件,其中包含了人类基因组 hg38 版本的外显子区域信息。

-nt 4-nt 参数指定并行运行的线程数,这里设置为 4 个线程。

出来以下结果,有些难懂。

可用multiqc整理一下就好看多了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/640609.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

stm32HAL_GPIO输入

学会使用 GPIO 采集 KEY 的数据信息,这种信息采集技术在生活中常见于对大自 然环境的各种信息的采集。比如环境温度,湿度等等。我们这里以 key 为入门设 备。 一,什么是信息采集 比如环境温度,湿度等等。我们需要把这些温度&am…

Linux thermal框架介绍

RK3568温控 cat /sys/class/thermal/thermal_zone0/temp cat /sys/class/thermal/thermal_zone1/temp cat /sys/class/thermal/cooling_device0/cur_state cat /sys/class/thermal/cooling_device1/cur_state cat /sys/class/thermal/cooling_device2/cur_state thermal_zone…

Cloud微服务:Ribbon负载均衡

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ Ribbon负载均衡 一、Ribbon - 负载均衡原理、流…

Oracle进阶(2)——物化视图案例延伸以及序列、同义词

一、物化视图 物化视图(Materialized View)是 Oracle 数据库中的一个对象,它是一个预先计算和存储的查询结果集,类似于视图,但与视图不同的是,物化视图会将查询结果保存在物理存储中,而不是动态…

WPF2022终结版系列课程笔记 1 WPF 基本布局

本笔记为B站 微软系列技术教程 WPF项目实战合集(2022终结版) 项目记录 WPF 基本布局 WPF布局原则 一个窗口中只能包含一个元素 不应显示设置元素尺寸 不应使用坐标设置元素的位置 可以嵌套布局容器 WPF布局容器 StackPanel: 水平或垂直排列元素、Orientation属性分别: Hor…

STP学习的第一篇

1.STP的基本概念:根桥 (1)STP的主要作用之一是在整个交换网络中计算出一棵无环的“树”(STP树)。 (2)根桥是一个STP交换网络中的“树根”。 (3)STP开始工作后&#xf…

K8s: Ingress对象, 创建Ingress控制器, 创建Ingress资源并暴露服务

Ingress对象 1 )概述 Ingress 是对集群中服务的外部访问进行管理的 API 对象,典型的访问方式是 HTTPIngress-nginx 本质是网关,当你请求 abc.com/service/a, Ingress 就把对应的地址转发给你,底层运行了一个 nginx但 K8s 为什么不…

OpenCV-基于阴影勾勒的图纸清晰度增强算法

作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 实现原理 大家在工作和学习中,无论是写报告还是论文,经常有截图的需求,比如图表、图纸等&…

无人驾驶 自动驾驶汽车 环境感知 精准定位 决策与规划 控制与执行 高精地图与车联网V2X 深度神经网络学习 深度强化学习 Apollo

无人驾驶 百度apollo课程 1-5 百度apollo课程 6-8 七月在线 无人驾驶系列知识入门到提高 当今,自动驾驶技术已经成为整个汽车产业的最新发展方向。应用自动驾驶技术可以全面提升汽车驾驶的安全性、舒适性,满足更高层次的市场需求等。自动驾驶技术得益于人工智能技术的应用…

SpringBoot 根据不同环境切换不同文件路径

最简单的办法就是使用多个 application.yml 配置文件 。一个叫 application-test.yml 测试用;另一个是正式使用的 application-prod.yml 。win环境下大部分是开发测试时候使用的,服务正式上线需要部署在Linux服务器上又换成了Linux。但开发初期或者项目…

JS-47-Node.js06-fs模块-读写文件

Node.js内置的fs模块就是文件系统模块,负责读写文件。 和所有其它JavaScript模块不同的是,fs模块同时提供了异步和同步的方法。 一、回顾:异步方法VS同步方法 1-1、异步方法 因为JavaScript的单线程模型,执行IO操作时&#xff…

Linux及tmux、vim常用命令

Linux 关于Linux的简介、诞生、迭代,大家可以去网上查一查,这里不多做赘述了 Linux文件类型 非常重要的文件类型有: 普通文件,目录文件,链接文件,设备文件,管道文件,Socket 套接字文件 等。 …