生物信息学数据库分类

生物信息学数据库

在这里插入图片描述

(一)文献数据库

1、PubMed:拥有超过两百六十万生物医学文献的数据库,这些文献来源于MEDLINE,也就是生物医学文献数据库、生命科学领域学术杂志、以及在线的专业书籍。链接:PubMed (nih.gov)

PubMed存在的问题

(1)搜索1995年前文献中排名是为以后的作者
(2)搜索1976年以前的文献是没有摘要的
(3)1965年前的文献较难搜索

(二)一级核酸数据库

1、※GenBank:是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划。为保证数据尽可能的完全,GeneBank与EMBL(欧洲EMBL-DNA数据库)、DDBJ(日本DNA数据库)共同构成国际核酸序列数据库合作联盟(INSDC),三大数据库的信息每日相互交换,更新汇总。链接:GenBank Overview (nih.gov)
  2、ENA:ENA Browser

ENA:欧洲核苷酸序列数据库(European Nucleotide Archive),由欧洲分子生物学研究室(European Molecular Biology Laboratory,EMBL)开发并维护。

3、DDBJ:DDBJ

DDBJ是日本DNA数据库(DNA Data Bank of Japan),由日本国立遗传学研究所(National Institute of Geneics, NIG)开发并负责维护。

以上三个数据库共同组成了国际核酸序列数据库合作联盟(International Nucleotide Sequence Database Collaboration,INSDC)。即这个数据库的信息可以相互交换,同步更新,共享。INSDC:International Nucleotide Sequence Database Collaboration

(三)、二级核酸数据库

二级核酸数据库包含的内容很多,经常会用到的几个数据库有:NCBI下属的RefSeq数据库,dbEST数据库以及Gene数据库。

RefSeq数据库:参考序列数据库,是通过自动及人工精选出的非冗余数据库,包括基因组序列、转录序列和蛋白质序列。

dbEST数据库:表达序列标签数据库,包含来源于不同物种的表达序列标签(EST)

Gene数据库:为用户提供基因序列注释和检索服务,收录了来自5300多个物种的430万条基因记录

ncRNAdb:非编码RNA数据库,提供非编码RNA的序列和功能信息。包含来源于99种细菌,古细菌和真核生物的3万多条序列。

ncRNA链接: http://biobases.ibch.poznan.pl/ncRNA/

miRBase:主要存放已发表的microRNA序列和注释。可以分析microRNA在基因组中的定位和挖掘miRNA序列间的关系。

miRBase链接: http://www.mirbase.org/

(四)一级蛋白质序列数据库

1、UniPort数据库,链接:UniProt

swissprot:人工注释,注释可信度高、冗余度小

TrEMBL:计算机注释,包含为蛋白质编码的核酸序列的所有翻译产物

PIR:支持基因组学、蛋白质组学和系统生物学研究的综合公共生物信息学资源

UniParc:收录所有UniPort数据库子库中的蛋白质序列,量大,粗糙

UniRef:归纳UniPort几个主要数据库并将重复序列去除后的数据库

UniProtKB:有详细注释并与其他数据库有链接的数据库

(五)一级蛋白质结构数据库

1、PDB:蛋白质结构数据库(PDB)是全世界唯一存储生物大分子3D结构的数据库。这些生物大分子除了蛋白质以外还包括核酸及两者的复合物。只有通过实验方法获得的3D结构才会被收入其中。链接:RCSB PDB: Homepage

(六)二级蛋白质数据库

1、Pfam数据库:Pfam数据库是一个蛋白质结构域家族的集合,包括了一万六千多个蛋白质家族

2、CATH:结构分类数据库CATH,根据结构域的空间特征可以对结构域进行分类。数据库中四种结构分类层次分别是:蛋白质种类(class,C)、蛋白质二级结构的构架(architecture,A)、蛋白质的拓扑结构(topology,T)、蛋白质同源超家族(homologous superfamily,H)

3、SCOP2:结构分类数据库,该数据库详细描述了已知结构的蛋白质在结构、进化事件与功能类型三个方面的关系。SCOP2把SCOP中仅基于蛋白质结构的树状等级分类系统发展成为单向非循环网状分类系统

(七)专项数据库

1、KEGG:京都基因与基因组百科全书(KEGG),是关于基因、蛋白质、生化反应及通路的综合生物信息数据库,由多个子库构成

2、OMIM:人类孟德尔遗传在线(OMIM),是一个有关人类遗传病的数据库,它将遗传病分类并链接到相关人类基因组中的数据库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/589699.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

游戏租赁如何利用好闲鱼获客,实现月入10000单月游戏粉引流2000+

1. 个人名片与基本信息扩展 在宝贝85的闲鱼账号中,我们可以看到她的个人信息非常详细。作为一名00后的女生,她喜欢摄影,就读于长沙理工大学,并且拥有极好的芝麻信用。这些信息有助于增加买家的信任度,提高交易成功率。…

iOS应用程序的签名、重签名和安装测试

目录 前言 打开要处理的IPA文件 设置签名使用的证书和描述文件 开始ios ipa重签名 前言 ipa编译出来后,或者ipa进行修改后,需要进行重新签名才能安装到测试手机,或者提交app store供apple 商店审核上架。ipaguard有签名和重签名功能&…

【MATLAB源码-第176期】基于matlab的16QAM调制解调系统频偏估计及补偿算法仿真,对比补偿前后的星座图误码率。

操作环境: MATLAB 2022a 1、算法描述 在通信系统中,频率偏移是一种常见的问题,它会导致接收到的信号频率与发送信号的频率不完全匹配,进而影响通信质量。在调制技术中,QPSK(Quadrature Phase Shift Keyin…

基于深度学习的铁轨缺陷检测系统(网页版+YOLOv8/v7/v6/v5代码+训练数据集)

摘要:本文深入研究了基于YOLOv8/v7/v6/v5的铁轨缺陷检测系统。核心技术上,文章采用了最先进的YOLOv8,并整合了YOLOv7、YOLOv6、YOLOv5算法,进行了性能指标的对比分析。文中详细阐述了国内外铁轨缺陷检测的研究现状、数据集处理方法…

[C++初阶]初识C++(一)—————命名空间和缺省函数

声明: 本篇文献内容选自百度文库、比特就业课 代码内容部分选自比特就业课 一、命名空间 1.什么是命名空间 在编程语言中,命名空间是一种特殊的作用域,它包含了处于该作用域中的所有标示符,而且其本身也是由标示符表示的。命名空间的使用目…

蓝桥杯(4):python动态规划DF[1]

动态规划相当于正着想?dfs主要适用于位置的变化? 子问题!状态,状态转移方程 1 一维DP 1.1 定义 重叠子问题!转换成子问题 ,与记忆化搜索很像 1.2 例子 1.2.1 上楼梯 子问题到最终的问题只能跨一步&…

Rredis缓存常见面试题

文章目录 1.什么是缓存穿透,怎么解决2.什么是缓存击穿,怎么解决3.什么是缓存雪崩,怎么解决4.双写一致性问题5.redisson添加的排他锁是如何保证读写、读读互斥的6.为什么不使用延迟双删7.redis做为缓存,数据的持久化是怎么做的8.re…

LInux脚本学习

1.注释 #单行注释 以 # 字符开头就是单行注释 当然第一行除外,比较特殊 2.多行注释 3.Shell文件的作用 Shell文件就是linux命令集 4.sh脚本的执行方式 bash xxx.sh 5.新建的文件会没有执行权限 #为文件赋予执行权限 chmod ux xxx.sh 6.编写规范 #!/bin/bash #…

Discuz! X3.5苗木_苗木网_苗木价格_苗木求购信息_苗木批发网模板utf-8

适合做苗木行业平台苗木网站、苗木信息网,提供苗木报价、各地苗木求购信息、绿化苗木采购招标、苗木基地展示、苗木百科知识、花木交易及苗木资讯、各地苗木信息网络行情。解压上传到template目录下,后台安装即可,包含PC手机端模板 下载地址:…

容器的底层技术:CGroup和NameSpace

无论是容器,还是虚拟机,都依赖于内核中的技术,虚拟机依赖的是 KVM,容器依赖的是 namespace 和 cgroup 对进程进行隔离和资源限制。 容器实现封闭的环境主要要靠两种技术,一种是看起来是隔离的技术,称为nam…

自然语言处理NLP概述

大家好,自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向,其研究能实现人与 计算机之间用自然语言进行有效通信的各种理论和方法。本文将从自然语言处理的本质、原理和应用三个方面,对其进行概述。 一、NLP的本质 NLP是一…

定时器-间歇函数

1.开启定时器 setInterval(function (){console.log(一秒执行一次)},1000) function fn(){console.log(一秒执行一次) } setInterval(fn,1000) //调用有名的函数,只写函数名 1.函数名字不需要加小括号 2.定时器返回是一个id数字 每个定时器的序号是不一样的 2.关…