深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

在生物信息学、合成生物学、药物研发、生物材料制备等领域,深度学习技术的革新正在重塑蛋白质设计工具的边界,使其从单纯的结构预测跃升至具有创造性的设计层面。RFdiffusion作为美国华盛顿大学David Baker教授团队的最新科研成果,凭借其卓越性能与开创性功能,标志着蛋白质设计步入全新阶段。
RoseTTAFold,作为David Baker教授团队早期开发的蛋白质结构预测工具,在学术界与工业界广受认可。然而,随着时间推移,David Baker教授团队敏锐洞察到,仅局限于预测已知结构的蛋白质并不能满足生物医药和生物工程领域对创新设计的需求。这促使David Baker教授团队继续深入研究突破。在此背景下,RFdiffusion应运而生,继承了RoseTTAFold的优良基因,但在功能上实现了质的飞跃,不仅能够预测蛋白质结构,更能够从无到有地进行创新设计。这种“从零开始”的设计理念赋予科学家们前所未有的设计自由度,这一突破不仅标志着蛋白质设计技术的重大进步,也意味着科研人员可以更深入地探究生命现象的本质,甚至创造出全新的生物功能和应用。
2023年7月11日,David Baker团队在国际顶级期刊《Nature》上发表了题为《De novo design of protein structure and function with RFdiffusion》的论文,全面揭示了RFdiffusion在蛋白质设计领域的核心竞争力,这篇论文的发表,无疑将蛋白质设计工具推向了一个全新的高度,昭示着未来蛋白质设计将更加注重创新性和实用性,以适应并推动生物医学、材料科学、生物信息学、合成生物学等多学科领域的前沿研究。
本次会议是在深度学习驱动蛋白质设计这一新兴领域快速发展的背景下举办,旨在系统介绍和深入探讨RFdiffusion与ProteinMPNN等前沿深度学习技术的原理、应用和最新研究成果,促进相关领域的科研人员、工程师及产业界人士对该领域的理解与技术掌握,推动深度学习技术在蛋白质设计领域的创新应用与实际转化。

适合生物信息学、结构生物学、合成生物学、药物研发、生物材料等相关领域的科研人员;生物医药、生物科技企业研发、技术部门负责人、对深度学习驱动蛋白质设计感兴趣的跨界人士

深度学习驱动的蛋白质设计技术与前沿实践-从基础到尖端应用

RFdiffusion 创新结构生成技术

一、背景介绍
1、从蛋白质预测到蛋白质设计
2、结构生成过程中的物理能量函数与约束
3、基于Deep learning的预测模型和生成模型
4、结构验证与性能评估
二、RFdiffusion基于指定骨架的蛋白质结构设计
核心知识点:利用用户提供的特定结构框架进行蛋白质结构设计
应用案例:
1、无约束单体设计(contigmap):全新骨架的蛋白质结构创新设计,通过RFdiffusion实现从头生成新颖、非同源蛋白质结构
2、特定骨架引导设计 (scaffoldguided):利用已有结构骨架指导蛋白质结构创新与改造

RFdiffusion 高级应用及领域热点
三、RFdiffusion含活性位点的蛋白质结构设计
核心知识点:使用RFdiffusion构建具有特定生物活性的蛋白质结构
应用案例:
1、Motifscaffold: inference.input_pdb & contigmap.inpaint_seq:如何整合已知活性位点信息,嫁接到设计的新蛋白质结构上
实例分析:酶活位点嫁接,对称位点嫁接的设计策略与实施
四、蛋白质-蛋白质相互作用界面(PPI):Binder设计
核心知识点:RFdiffusion设计能有效介导蛋白间相互作用的Binder区域
应用案例:
1、ppi.hotspots:识别和利用PPI热点信息来定制Binder结构
2、设计实例:针对指定骨架和/或特定motif的Binder结构创建
五、RFdiffusion中的对称性设计
核心知识点:阐述如何在蛋白质结构设计中考虑并实现对称性特征
应用案例:
1、Inference.symmetry: 对称性建模与控制
2、potentials:优化对称单元间的能量分布与稳定性
六、多样性
核心知识点:探究RFdiffusion在处理结构多样性上的机制和优势
应用案例:diffuser.partial_T:局部扩散与全局优化结合,提高结构多样性和稳健性、RFdiffusion中的noise

ProteinMPNNLigandMPNN 序列设计基础与高级应用
七、ProteinMPNN序列设计入门
核心知识点:介绍ProteinMPNN的核心架构与训练过程,掌握ProteinMPNN和LigandMPNN在不同场景下的蛋白质结构序列设计流程
应用案例:
1、Monomer单体序列设计:用ProteinMPNN针对单体蛋白质进行序列设计
2、Complex复合物zhong 指定链设计:利用ProteinMPNN在复合物环境下设计特定链的序列,涉及链间相互作用的考虑与优化。
Models, Helper scripts, number of sequences:深入了解模型使用方法、辅助脚本的功能以及决定生成序列数量的因素

ProteinMPNN和LigandMPNN 序列设计基础与高级应用
八、指定设计位点与氨基酸偏好性设置
核心知识点:在蛋白质设计中如何运用深度学习工具来精准控制特定氨基酸残基的位置与特性
应用案例:
1、Fix position与Redesign position:保留某些部位不变(Fix position)和重新设计其他部位(Redesign position)的具体操作。
Bias AA与Omit AA:在设计过程中如何设置氨基酸偏好性,包括优先选择某些氨基酸(Bias AA)和排除特定氨基酸(Omit AA),以满足特定功能需求或生物物理化学特性。

RFdiffusion与ProteinMPNN 高级应用案例分析
九、MPNN进阶应用
核心知识点:MPNN对称性处理与同聚多体设计、MPNN设计多样性与温度参数调控
应用案例:
1、MPNN处理对称性Symmetry:讲解MPNN如何识别和处理蛋白质的对称性特征,特别是对于Homooligomers(同聚多体)的设计。
2、Tied position(绑定位置):探讨MPNN在处理需要保持多个位置协同变化以维持特定对称模式的情况下的具体方法。
MPNN设计多样性:探究MPNN如何通过温度参数调整来促进设计序列的多样性,以及多样性对最终蛋白质功能和稳定性的影响。

RFdiffusion与ProteinMPNN 高级应用案例分析
十、Colabfold 结构预测与深度学习应用
1、MSA、pLDDT和pAE:介绍多序列比对(Multiple Sequence Alignment)、预测精度得分(predicted Local Distance Difference Test, pLDDT)和原子接触误差(predicted Atomic Error, pAE)在蛋白质结构预测中的重要作用。
2、逆转网络与幻想蛋白设计
探讨如何通过深度学习技术逆向设计已知结构或创造新型蛋白质结构的可能性。

互动讨论
1、分享与解析近期领域内热点研究成果中RFdiffusion + ProteinMPNN的实际应用案例
2、讨论并解决实际操作中可能遇到的问题与挑战,进一步提升学员对深度学习在蛋白质结构设计领域中的理解和应用能力

最新顶刊文献中对应的该课程内深度学习蛋白质结构设计技术

RoseTTAFold Diffusion
De novo design of protein structure and function with RFdiffusion. Nature. 2023, 620(7976):1089-1100
De novo design of high-affinity binders of bioactive helical peptides. Nature. 2024, 626(7998):435-442 (多肽Binder)
Computational design of sequence-specific DNA-binding proteins. bioRxiv. 2023.09.20.558720 (核酸Binder)
Atomically accurate de novo design of single-domain antibodies. bioRxiv. 2024.03.14.585103v1

ProteinMPNN
Robust deep learning–based protein sequence design using ProteinMPNN. Science. 2022, 378(6615):49-56.
Improving Protein Expression, Stability, and Function with ProteinMPNN. J Am Chem Soc. 2024, 146(3):2054-2061.

LigandMPNN
Atomic context-conditioned protein sequence design using LigandMPNN. bioRxiv. 2023.12.22.573103v1

RoseTTAFold and RFDesign
Accurate prediction of protein structures and interactions using a three-track neural network. Science. 2021, 373 (6557) : 871-876.
Efficient and accurate prediction of protein structure using RoseTTAFold2. bioRxiv. 2023.05.24.542179v1
Accurate prediction of protein–nucleic acid complexes using RoseTTAFoldNA. Nat Methods. 2024, 21(1):117-121.
Generalized biomolecular modeling and design with RoseTTAFold All-Atom. Science. 2024, eadl2528.
Scaffolding protein functional sites using deep learning. Science. 2022, 377(6604):387-394.

trRosetta and trDesign
Improved protein structure prediction using predicted interresidue orientations. Proc Natl Acad Sci U S A. 2020, 117 (3) : 1496-1503.
Protein sequence design by conformational landscape optimization. Proc Natl Acad Sci U S A. 2021, 118(11):e2017228118.
De novo design of small beta barrel proteins. Proc Natl Acad Sci U S A. 2023, 120(11):e2207974120.

Colabfold, Alphafold and ESMfold
ColabFold making protein folding accessible to all. Nat Methods. 2022, 19(6):679-682.
Improved protein structure prediction using potentials from deep learning. Nature. 2020, 577(7792):706-710.
Highly accurate protein structure prediction with AlphaFold. Nature. 2021, 596(7873):583-589.
Protein complex prediction with AlphaFold-Multimer. bioRxiv. 2021.10.04.463034v2.
Evolutionary-scale prediction of atomic-level protein structure with a language model. Science. 2023,379(6637):1123-1130.

幻想蛋白
部分案例图示:(见下页)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/619679.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot+vue科普知识商城考试论坛交流系统网站

本系统主要是设计出新能源科普网站,基于B/S构架,后台数据库采用了Mysql,可以使数据的查询和存储变得更加有效,可以确保新能源科普网站管理的工作能够正常、高效的进行,从而提高工作的效率。总体的研究内容如下&#xf…

软考之零碎片段记录(十五)+复习巩固(十)

一、学习 1. 多对多关系模式 举例:学生和课程。顾客和商品等。 多对多关系的确立需要有中间表,需要使用两个外键确认表中的唯一数据。 2. 数据库范式 1nf 表中每个字段都是原子性不可查分的。在关系(或表)中,每一行…

2024年跨境电商展览会,深圳+广州+厦门+宁波等地火力全开!

雨果网CCEE全球跨境电商展览会(深圳) 深圳会展中心(福田) 2024年5月11日-13日 2024第七届全球跨境电商节暨第九届深圳国际跨境电商贸易博览会 2024年 6月15日—17日 在深圳会展中心(福田) ICBE2024深圳国际跨境电商交易博览会 2024年9月02-04日 …

【leetcode面试经典150题】35.螺旋矩阵(C++)

【leetcode面试经典150题】专栏系列将为准备暑期实习生以及秋招的同学们提高在面试时的经典面试算法题的思路和想法。本专栏将以一题多解和精简算法思路为主,题解使用C语言。(若有使用其他语言的同学也可了解题解思路,本质上语法内容一致&…

云服务器上Docker启动的MySQL会自动删除数据库的问题

一、问题说明 除了常见的情况,例如没有实现数据挂载,导致数据丢失外,还需要考虑数据库是否被攻击,下图 REVOVER_YOUR_DATA 就代表被勒索了,这种情况通常是数据库端口使用了默认端口(3306)且密码…

【Linux网络编程】UDP协议

UDP协议 1.再谈端口号端口号划分认识知名端口号(Well-Know Port Number)两个问题netstatpidof 2.UDP协议2.1UDP的特点2.2面向数据报2.3UDP的缓冲区2.4UDP使用注意事项2.5基于UDP的应用层协议 喜欢的点赞,收藏,关注一下把! 1.再谈端口号 端口…

【力扣】101. 对称二叉树

101. 对称二叉树 题目描述 给你一个二叉树的根节点 root , 检查它是否轴对称。 示例 1: 输入:root [1,2,2,3,4,4,3] 输出:true 示例 2: 输入:root [1,2,2,null,3,null,3] 输出:false 提示…

五、书架开发--4.电子书离线缓存功能开发

电子书缓存功能需要用到IndexedDB数据库 为什么需要用到IndexedDB数据库呢,在浏览器中有cookie,不过容量很小不超过4K;H5中增加了localstorage,但是容量还是小,只能存储2.5-10兆之间,同时还不能建立自定义…

Ceph [OSDI‘06]论文阅读笔记

原论文:Ceph: A Scalable, High-Performance Distributed File System (OSDI’06) Ceph简介及关键技术要点 Ceph是一个高性能、可扩展的分布式文件系统,旨在提供出色的性能、可靠性和可扩展性。为了最大化数据和元数据管理的分离,它使用了一…

2024年第十五届蓝桥杯C/C++B组复盘(持续更新)

🔥博客主页: 小羊失眠啦. 🎥系列专栏:《C语言》 《数据结构》 《C》 《Linux》 《Cpolar》 ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录 试题A:握手问题问题描述思路 试题B:小球反弹问题描述思路…

CSS导读 (元素显示模式 上)

(大家好,今天我们将继续来学习CSS的相关知识,大家可以在评论区进行互动答疑哦~加油!💕) 目录 三、CSS的元素显示模式 3.1 什么是元素显示模式 3.2 块元素 3.3 行内元素 3.4 行内块元素 3.5 元素…

Centos7 K8S 集群 - kubeadm搭建方式

机器准备 搭建环境是centos7, 四核心4G内存四台机器 一个master节点,一个etcd,两台node 机器名称IP 地址master192.168.1.127node1192.168.1.129node2192.168.1.130node3192.168.1.131 机器时间同步 各节点时间要求精确同步,可以直接联网…