Alphafold2蛋白质结构预测AI工作站配置推荐

AlphaFold2计算特点

       蛋白质三维结构预测是一项计算量非常巨大的任务,科学家多年的探索研究,形成了X射线晶体学法、核磁共振法、冷冻电镜等。
       2021年底,谷歌的DeepMind团队的采用人工智能方法的AlphaFold2算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,AlphaFold2是当今预测蛋白质3D结构的最强工具。它将被大量用于推动世界蛋白质研究向前发展。

        AlphaFold2在国际蛋白质结构预测竞赛(CASP14)上精确地基于氨基酸序列预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。

目前情况(大致统计):
(1)Deepmind开源了AlphaFold2的源代码(推理部分)
(2)华盛顿大学开源了RoseTTRFold的源代码(推理部分)
(3)深势科技复现了AlphaFold的训练部分,并开源代码(训练和推理)
(4)上海天壤智能科技有限公司复现了TRfold训练部分和推理部分
(5)上海交大对AlphaFold2的推理代码进行了优化(推理并行版)

(一)AlphaFold2蛋白质结构预测计算特点
如何配置好硬件,最快速度完成训练、推理计算,首先分析其计算过程以及算法特点。

                                                      图1 Alphafold2计算示意图

环节1 数据处理-序列特征生成计算特点

                                     (图片2来源:上海交大alphafold2并行优化版)

计算过程
总输入单个蛋白质序列FASTA格式(推理);
通过搜索工具(jackHMMER/HHblits)分别对多个遗传数据库--执行隐马尔可夫模型的搜索生成MSA(序列-残基);见图1
搜索的结构和序列产生的Pairing信息(残基-残基);
通过HHsearch搜索的Template;

计算与硬件配置分析
数据库搜索过程涉及数据库密集I/O读写,数据放到高速SSD硬盘上,数据量累积超过2TB,非常耗时,加速手段提升CPU计算速度。

硬件配置
CPU计算为主,内存要够大,或配备NVME SSD固态卡,容量4TB以上
环节2 神经网络预测计算特点

(图片来源:上海交通大学 https://parafold.sjtu.edu.cn/docs/quick-start/)

计算过程
利用多序列比对(MSA),把蛋白质的结构和生物信息整合到深度学习算法中,主要包括:神经网络EvoFormer和结构模块(Structure module).
在EvoFormer中,主要是将图网络(Graph networks)和多序列比对(MSA)结合完成结构预测,Alphafold2使用Transformer结构,不管是MSA还是残基-残基对的信息更新都使用了Attention机制,结构模块的更新使用了三角法则,简化了计算的复杂度,准确率也提高了不少.
结构模块(Structure Module)主要工作是将EvoFormer得到的信息转换为蛋白质3D结构.
整个模型的Evoformer和Structure module部分都使用了Recycling,即将输出重新加入到输入在重复refinement,进行信息的精炼.
计算特点
上述计算过程用GPU更合理,对GPU要求是高显存带宽、大容量显存、大蛋白质计算通过将多GPU卡设置统一内存架构,大的显存可支持更大的计算数据存放。

计算架构分析汇总

(二)蛋白质结构预算AI工作站配置推荐:

       西安坤隆计算机科技有限公司专注于工作站专业应用,对每个应用的计算过程研究分析,给出精准高效、高可靠计算架构和专业系统优化,以及稳定的技术支持,保证与应用软件90%以上的匹配吻合,和长期稳定运行。

硬件配置具有以下特点:
1)配备CPU规格均以高频为主,兼顾足够CPU核数,这样保证数据预处理(最慢的环节),计算时间大幅缩短,GPU卡采用单精度指标高的、显存容量大的,保证神经预测计算加速,满足AlphaFold2的理想的配置方案
2)整机的cpu、gpu、硬盘配置,满足AlphaFold2推理(包括上海交大并行版)计算要求,均衡无死角,性能最大化;
3)为深势科技的Uni-Fold训练、推理模块提供理想配置架构;
4)每个配置机器做到即开即用,并提供硬件+优化+稳定高速运行技术支持服务
5)支持大规模的计算扩展应用需求

2.1 蛋白质结构预测工作站配置参考

​​​​​​​

​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/339594.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

18-链表-移除链表元素

这是链表的第18题,力扣链接。 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1: 输入:head [1,2,6,3,4,5,6], val 6 输出:[1,2,3,…

PHP短链接url还原成长链接

在开发过程中,碰到了需要校验用户回填的短链接是不是系统所需要的,于是就需要还原找出短链接所对应的长链接。 长链接转短链接 在百度上搜索程序员,跳转页面后的url就是一个长链接。当然你可以从任何地方复制一个长链接过来。 长链接 http…

17- Echarts 配置系列之:单轴 singleAxis

singleAxis: 用于展示只有一个数据维度的数据。它通常用于展示时间序列数据或者数值序列数据。 对于单轴的应用和绘制,其实就相当于我们平时的直角坐标系少一个 X 或者 Y ,然后进行图形绘制。 注意: 1.在使用单轴时&#xff0…

Android Firebase (FCM)推送接入

官方文档: 向后台应用发送测试消息 | Firebase Cloud Messaging 1、根级(项目级)Gradlegradle的dependencies中添加: dependencies {...// Add the dependency for the Google services Gradle pluginclasspath com.google.gm…

使用组合框QComboBox模拟购物车

1.组合框: QComboBox 组合框:QComboBox 用于存放一些列表项 实例化 //实例化QComboBox* comboBox new QComboBox(this);1.1 代码实现 1.1.1 组合框的基本函数 QComboBox dialog.cpp #include "dialog.h" #include "ui_dialog.h"Dialog::Dialog…

UM2004 一款低功耗、高性能、即插即用型 OOK 射频接收器芯片

UM2004 是一款低功耗、高性能、即插即用型 OOK 射频接收器,该芯片具有 2.5V ~ 5.5V 较宽的输入电压范围,灵敏度高达到-109dBm,工作频段为 300MHz ~ 480MHz,支持 1Kbps~ 5Kbps 的数据率传输。采用 SOP8 封装类型,应用时…

如何将MIUI系统转换为AOSP Material You系统?

如何将MIUI系统转换为AOSP Material You系统? 许多安卓用户都喜欢使用原始设备制造商(OEM)ROM,也有一部分用户喜欢更接近原版安卓系统(AOSP)的体验。然而,MIUI系统往往难以达到用户希望的AOSP外…

4《数据结构》

文章目录 绪论逻辑结构存储结构【物理结构】顺序和链式存储区别顺序表和数组区别数组和链表的区别链表结点概念链表为空条件链表文章http://t.csdnimg.cn/dssVK二叉树B树B树【MYSQL索引默认数据结构】B树和B树区别冒泡排序插排选排快排 绪论 数据结构:研究非数值计…

对外贸易数据平台解析_外贸三大支撑力_箱讯科技

添加图片注释,不超过 140 字(可选) 三大支撑力支撑我国外贸持续回暖 海关总署近日发布数据显示,今年前11个月,我国进出口总值37.96万亿元,与去年同期持平。进入四季度,我国外贸发展的积极因素…

100个GEO基因表达芯片或转录组数据处理之GSE159676(002)

写在前边 虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友…

使用 gitee+sphinx+readthedocs 搭建个人博客

给大家安利如何快速搭建个人博客网站! 前言 这是我本地运行的一个使用sphinx构建的博客服务,这些文章,都是用markdown写的。 一直有个想法,就是把自己写的这些文件,搞成一个博客网站,放到网上&#xff0c…

全新小白菜QQ云端机器人登录系统源码 /去除解密授权学习版源码

源码介绍: 全新小白菜QQ云端机器人登录系统源码,是一款经过全面解密的授权学习版源码。 这款源码已解除了授权版的限制,然而许多人可能对其用途并不了解。实际上,该源码主要面向群机器人爱好者设计。它是一个基于挂机宝机器人框…