模型参数超 RFdiffusion 5倍!英伟达等发布 Proteina,从头设计蛋白质主链性能达 SOTA

该成果入选 ICLR 2025 Oral

模型参数超 RFdiffusion 5倍!英伟达等发布 Proteina,从头设计蛋白质主链性能达 SOTA

原标题:模型参数RFdiffusion 5倍!英伟达等发布 Proteina,从头设计蛋白质主链性能达 SOTA
文章来源:HyperAI超神经
内容字数:10159字

AI赋能蛋白质设计:从结构预测到从头设计

本文概述了人工智能技术在蛋白质设计领域的最新进展,特别是英伟达联合其他研究机构开发的Proteina模型,以及中国在该领域的创新成果。

  1. 蛋白质设计领域的挑战与AI的突破

    自上世纪以来,科学家们一直致力于预测蛋白质结构和设计全新蛋白质。AI技术的兴起,特别是深度学习的应用,为这一领域注入了新的活力。2016年,深度残差网络ResNet的引入显著提升了蛋白质残基接触预测的准确性,为AI与蛋白质设计的深度融合奠定了基础。此后,AlphaFold等模型的出现,将蛋白质结构预测推向了新的高度。然而,以往的蛋白质结构生成模型通常规模较小,数据量有限,缺乏有效的控制手段。

  2. Proteina模型:大规模流式蛋白质主链生成器

    为了克服现有模型的局限性,英伟达联合Mila、蒙特利尔大学和麻省理工学院的研究团队开发了Proteina模型。Proteina采用可扩展非等变Transformer架构,参数量是RFdiffusion模型的5倍,训练数据扩展到2100万个合成蛋白质结构。它能够生成高达800个残基的主链,并保持多样性和可设计性,在从头设计蛋白质主链方面达到了最先进的性能。Proteina在训练中使用了创新的方法,包括调整流匹配目标、分阶段训练策略以及新的引导方案,以增强蛋白质的可设计性。其研究成果已入选ICLR 2025 Oral。

  3. 中国在AI蛋白质设计领域的贡献

    中国在AI驱动的蛋白质设计领域也取得了显著进展。多个研究团队和企业开发了具有自主知识产权的蛋白质设计平台和模型,例如:上海天壤XLab的TRDesign平台、分子之心的NewOrigin大模型、无锡途深智合的TourSynbio大模型、中科院计算所的CarbonNovo模型以及中科大团队的SCUBA-D模型等。这些模型在蛋白质结构预测、序列设计和从头设计等方面展现出强大的能力,并已在产业应用中得到验证。这些成果体现了中国在该领域的创新实力和技术积累。

  4. 未来展望

    随着AI技术的不断发展,以及大语言模型在蛋白质设计领域的应用,该领域有望取得更多突破。中国在AI驱动的蛋白质设计领域已形成独特的技术生态,未来将涌现更多创新成果,为全球生命科学研究和生物医药产业发展做出贡献。


联系作者

文章来源:HyperAI超神经
作者微信:
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...