南开大学郑伟教授:AlphaFold并不完美,学术界尚有「弯道超车」的机会
从 AlphaFold 的局限性出发,深度分享端到端大模型之外的可能
原标题:南开大学郑伟教授:AlphaFold并不完美,学术界尚有「弯道超车」的机会
文章来源:HyperAI超神经
内容字数:11478字
AlphaFold并非完美:学术界在蛋白质结构预测领域的突破
本文总结了南开大学郑伟教授在“Meet AI4S”系列直播第六期中关于蛋白质结构预测的演讲内容。演讲指出,尽管AlphaFold2和AlphaFold3在蛋白质结构预测领域取得了突破性进展,并使DeepMind的Demis Hassabis和John M. Jumper获得了2024年诺贝尔化学奖,但AlphaFold仍存在诸多局限性,为学术界提供了进一步研究和改进的空间。
1. AlphaFold的局限性
AlphaFold2和AlphaFold3虽然精度高,但在多域蛋白质、蛋白质复合物、核酸结构以及蛋白质动态/构象变化预测等方面仍有待提升。其预测精度也低于官方报道的90%。这些局限性为学术界提供了大量的研究课题。
2. 超越AlphaFold:其他值得挖掘的方法
在AlphaFold出现之前,蛋白质结构预测主要依赖于实验方法(X射线、核磁共振、冷冻电镜)以及多种计算方法,包括:比较建模/同源建模(利用已知结构模板)、分子动力学模拟(基于能量最小化)、Threading算法(利用序列相似性和结构相似性)、从头预测(de novo prediction,无需模板)以及基于深度学习预测接触图的算法。
3. 郑伟教授团队的突破性成果
郑伟教授团队在蛋白质结构预测领域取得了显著成果,其开发的算法在精度上超越了AlphaFold2/3。团队主要贡献体现在以下几个方面:
- 蛋白质单体结构预测算法D-I-TASSER:该算法整合了AlphaFold2预测的接触图等信息,在精度上优于AlphaFold2和AlphaFold3,并在CASP比赛中多次名列前茅。
- 蛋白质复合物结构预测算法DMFold:该算法利用深度学习和宏基因组数据,在预测蛋白质复合物结构方面优于AlphaFold2,在CASP比赛中也取得了优异的成绩。
- RNA-RNA复合物结构预测算法ExFold:该算法利用Transformer模型和RNA大语言模型,在RNA复合物结构预测方面表现出色,在CASP16的服务器组比赛中排名最高。
- 蛋白质-RNA复合物结构预测算法DeepProtNA:该算法在预测蛋白质-RNA复合物结构方面精度高于AlphaFold3,在CASP16服务器组比赛中排名第一。
- 生物大分子变构结构预测算法EnsembleFold:该算法能够预测蛋白质在不同状态下的多个关键构象,在CASP16比赛中排名第一。
这些算法已转化为自动服务器算法,服务于全球众多用户。
4. 未来展望与团队招募
郑伟教授团队的研究表明,AlphaFold并非蛋白质结构预测领域的终点,学术界仍有巨大的发展空间。团队目前正在招募对计算结构生物学或生物信息学感兴趣的硕士、博士和博士后。
联系作者
文章来源:HyperAI超神经
作者微信:
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例