这个表格展示了 Igformer 模型在不同消融实验条件下的性能变化。消融实验的核心在于移除或修改模型的某些关键组件,观察其对模型性能的影响,以评估这些组件的重要性。
表格消融项解释:
-
- Residue-level only
移除内容:移除了原子级嵌入,仅保留残基级别嵌入。
解释:Igformer 的嵌入包括两层次的特征表示:残基级和原子级。消融原子级嵌入意味着模型不再使用更精细的原子信息,仅依赖较粗略的残基表示。
影响:模型在生成和对接任务中的性能下降,表明原子级嵌入对提升精度至关重要。 -
- Atom embeddings
移除内容:移除了所有原子嵌入,只保留残基位置嵌入。
解释:这个实验进一步剥离了模型的细粒度原子特征,使模型仅依赖残基的类型和位置嵌入。
影响:性能大幅下降,说明原子嵌入在提升结构预测和对接任务方面起到了重要作用。 -
- Triangle passing
移除内容:移除了三角消息传递模块 (Triangle Message Passing Module)。
解释:三角消息传递模块是模型用于捕捉残基与其他残基之间关系的重要组件。它通过三角几何关系来增强模型的特征传递和交互建模能力。消融这个模块后,模型无法有效学习复杂的残基交互。
影响:模型对局部和全局结构的预测精度下降,表明三角模块在建模配体和抗体残基关系方面至关重要。
其他消融项解释:
-
- Axial attention
移除内容:移除了轴向注意力机制 (Axial Attention Module)。
解释:轴向注意力负责沿不同轴(如行和列)对模型输入进行注意力计算,帮助模型学习全局特征。移除后,模型无法有效捕捉序列间的长程依赖。
影响:性能略有下降,说明轴向注意力在全局特征捕捉方面起到一定作用。 -
- APPNP
移除内容:移除了APPNP (Approximate Personalized Propagation of Neural Predictions) 模块。
解释:APPNP 负责将局部嵌入传播到全局,同时保留初始嵌入,确保信息在模型中均匀传播。
影响:移除后,模型的 DockQ 和 RMSD 表现下降,表明 APPNP 在局部和全局特征融合方面非常重要。 -
- SGFormer
移除内容:移除了SGFormer 自注意力机制。
解释:SGFormer 允许模型动态计算残基之间的重要性,帮助模型学习复杂残基交互。
影响:移除后模型性能下降,证明 SGFormer 对提升模型复杂关系建模起到了积极作用。 -
- Graph separation
移除内容:合并了内部图 (Intra-graph) 和外部图 (Inter-graph),不再分离抗体内部和抗原-抗体交互的学习过程。
解释:Igformer 采用分离图结构分别学习抗体内部和抗体-抗原间的交互。此消融实验验证了分离图与合并图的性能差异。
影响:模型性能下降,说明分离图机制对抗原-抗体交互建模有积极作用。
结论:
- 消融实验验证了 原子级嵌入、三角消息传递和多层交互机制对模型性能的关键作用。
- 表格中的每个消融项对应 Igformer 模型不同模块的移除或修改,实验结果表明,这些模块在提升抗体生成与对接精度方面不可或缺。
其他可参考的地方
在这个表格中,我们进行了多种消融实验,以评估 Igformer 模型中不同组件对模型性能的影响。消融实验的目标是通过移除或替代关键模块,观察模型在抗体-抗原复合物预测和抗体设计任务中的表现变化,找出哪些模块对最终性能至关重要。
1. 实验任务与指标
- 任务1:CDR-H3 设计 – 生成抗体的重链第三互补决定区(CDR-H3),这是决定抗体特异性和亲和力的重要部分。
- 任务2:复合结构预测 – 预测抗体和抗原复合物的三维结构。
实验指标
- AAR (Amino Acid Recovery, 氨基酸恢复率, %):生成的氨基酸序列与真实序列的匹配度,越高越好。
- TMscore (Template Modeling score):评估模型预测结构与真实结构的相似性,越接近1表示结构预测越准确。
- lDDT (Local Distance Difference Test):用于测量局部结构的精度,值越高表示预测模型在局部原子级结构上的表现越好。
- CAAR (Correctly Aligned Antibody Residues, %):正确对齐的抗体残基比例,越高表示更准确的抗体对接。
- RMSD (Root Mean Square Deviation):预测结构与真实结构之间的均方根偏差,越低表示预测精度越高。
- DockQ:用于量化分子对接结果的评分,综合考虑对接精度、界面接触和原子间距离,越高表示对接质量越好。
2. 消融实验内容
1. 残基和原子级嵌入
- 实验目的:分析模型在仅使用残基级嵌入或同时结合原子级嵌入时的表现差异。
- 消融方法:
- 移除原子级嵌入,仅保留残基级嵌入,以观察模型对更精细原子级信息的依赖性。
- 移除位置嵌入或原子位置嵌入,以检查坐标信息对最终预测精度的影响。
- 结果:移除原子级嵌入后,模型在生成任务和对接任务中的性能下降,说明原子级信息在提升精度方面发挥了重要作用。
2. 三角消息传递模块 (Triangle Message Passing)
- 实验目的:验证三角消息传递模块在建模配体和抗体残基关系中的重要性。
- 消融方法:
- 移除三角消息传递模块,仅保留轴向注意力机制。
- 用简单的多层感知机 (MLP) 或其他基本聚合方法替代三角消息传递模块。
- 分别消融 outgoing 和 ingoing 方向的三角模块,评估单个方向的贡献。
- 结果:移除该模块导致 lDDT 和 DockQ 下降,说明三角消息传递在捕获残基-残基相互作用方面至关重要。
3. 轴向注意力模块 (Axial Attention)
- 实验目的:评估轴向注意力在捕捉全局特征中的作用。
- 消融方法:
- 移除轴向注意力,仅保留三角消息传递模块。
- 将轴向注意力替换为多头自注意力机制 (Multi-head Self-attention),比较模型性能差异。
- 结果:消融轴向注意力后,模型在生成和复合结构预测任务中表现略有下降,说明轴向注意力在整合全局信息方面有一定作用。
4. APPNP 和 SGFormer 组件
- 实验目的:分析局部和全局信息传播机制(APPNP 和 SGFormer)在模型中的重要性。
- 消融方法:
- 分别移除 APPNP 或 SGFormer,仅保留其中一个组件,观察局部或全局信息传播的重要性。
- 用 GCN (Graph Convolutional Network) 或 GAT (Graph Attention Network) 替换 SGFormer,以验证 SGFormer 的有效性。
- 结果:移除 APPNP 或 SGFormer 后,DockQ 和 RMSD 表现下降,说明两个模块互补,缺一不可。
5. 内部图 (Intra-graph) 和外部图 (Inter-graph) 分离机制
- 实验目的:分析分离抗体内部交互和抗原-抗体交互图的必要性。
- 消融方法:
- 合并 Intra-graph 和 Inter-graph,使用一个联合图进行学习,比较模型效果。
- 在 Intra-graph 和 Inter-graph 之间共享坐标,不分开更新,分析空间信息分离的重要性。
- 结果:合并图后,模型对抗体与抗原的对接精度有所下降,说明分离机制可以更有效地捕捉不同层次的信息交互。
3. 消融实验结果分析
- 消融实验结果表明,每个模块都对模型最终性能有一定贡献。尤其是:
- 原子级嵌入和位置嵌入 对 lDDT 和 DockQ 的提升至关重要,表明更细粒度的特征对抗体结构预测精度有显著影响。
- 三角消息传递模块 是提升模型捕捉残基关系和配体交互的关键,缺失后模型性能明显下降。
- APPNP 和 SGFormer 组合使用 提供了全局和局部的信息传播机制,二者缺一不可。
- 分离内部图与外部图 的方法有效提高了抗原-抗体对接精度,验证了不同层次关系建模的重要性。
这些消融实验为模型设计提供了深入的洞察,并明确了 Igformer 模型中各组件的必要性和独特作用。