入选ICLR 2025!浙大沈春华等人提出玻尔兹曼对齐技术,蛋白质结合能预测达SOTA

将蛋白质发生突变时结合能的变化与氨基酸序列出现的可能性联系起来

入选ICLR 2025!浙大沈春华等人提出玻尔兹曼对齐技术,蛋白质结合自由能预测达SOTA

原标题:入选ICLR 2025!浙大沈春华等人提出玻尔兹曼对齐技术,蛋白质结合能预测达SOTA
文章来源:HyperAI超神经
内容字数:10044字

浙江大学沈春华教授团队在蛋白质相互作用研究领域取得突破性进展

本文报道了浙江大学计算机科学与技术学院沈春华教授团队与澳大利亚阿德莱德大学、美国东北大学等团队合作,在蛋白质-蛋白质相互作用(PPIs)研究领域取得的重大突破。该团队提出了一种名为“玻尔兹曼对齐”的技术,显著提高了突变效应(∆∆G)预测的准确性,相关成果发表在人工智能领域顶级会议ICLR 2025上。

1. 蛋白质相互作用研究的意义与挑战

准确预测蛋白质间的相互作用对于理解生命活动、研发靶向药物等至关重要。虽然AlphaFold 3等技术提升了蛋白质结构预测的准确率,但蛋白质间的相互作用是一个动态过程,仅依靠静态结构难以完全捕捉其本质。准确预测结合能变化(∆∆G)是理解和调节PPIs的关键,但传统方法存在费时费力、准确性不足等问题。

2. 基于深度学习的∆∆G预测方法

深度学习方法为∆∆G预测带来了新的机遇。例如,中科院团队提出的SidechainDiff方法利用黎曼扩散模型取得了较好效果。然而,现有深度学习方法也面临挑战,例如结合能的注释实验数据缺乏,导致许多团队采用预训练策略,但简单的监督微调可能导致模型“遗忘”预训练期间获得的知识,造成过拟合。

3. 玻尔兹曼对齐技术:创新突破

沈春华教授团队提出的玻尔兹曼对齐技术,巧妙地将知识从预训练的逆折叠模型迁移到∆∆G预测。该技术基于玻尔兹曼分布和热力学循环原理,将蛋白质突变时结合能的变化与蛋白质氨基酸序列出现的可能性联系起来。团队提出了BA-Cycle和BA-DDG两种方法,分别用于无监督和有监督的∆∆G预测。在SKEMPI v2数据集上的实验结果表明,BA-DDG在各项指标上均优于现有SOTA方法,BA-Cycle也达到了与经验能量函数相当的性能。

4. 技术细节与优势

玻尔兹曼对齐技术通过引入贝叶斯定理,巧妙地规避了直接估计蛋白质结构概率的难题,并利用逆折叠模型评估结合态和非结合态的序列概率。BA-Cycle方法在热力学循环中明确考虑了未结合态概率,BA-DDG则通过微调进一步提升了预测精度,同时避免了过拟合风险。

5. 广泛的应用前景

该研究成果在结合能量预测、蛋白质-蛋白质对接和抗体优化等方面都展现了良好的适用性,为药物设计和虚拟筛选等领域提供了新的工具,具有重要的应用价值。

6. 沈春华教授团队及其其他研究成果

沈春华教授团队长期致力于机器学习和计算机视觉方向的研究,在2025年年初已发表多篇论文,涵盖DNA基础模型、视觉通用模型和视频生成模型评估等多个领域,展现了其强大的科研实力和影响力。

总之,沈春华教授团队的这项研究成果为蛋白质相互作用研究提供了新的方法和思路,为理解生命过程和发展新药提供了重要的理论基础和技术支撑。


联系作者

文章来源:HyperAI超神经
作者微信:
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例

阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...