登Nature子刊!北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%

可跨病毒类型、跨毒株预测,泛化能力极佳

登Nature子刊!北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%

原标题:登Nature子刊!北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%
文章来源:HyperAI超神经
内容字数:10141字

北京大学团队研发E2VD框架,精准预测病毒进化

本文介绍了北京大学信息工程学院田永鸿教授、陈杰副教授团队与广州国家实验室周鹏研究员合作,由博士生聂志伟、硕士生刘旭东等完成的一项重要研究成果:进化驱动的病毒变异驱动力预测框架E2VD。该框架发表于2025年1月17日的《Nature Machine Intelligence》杂志,能够精准预测新冠病毒、流感病毒、寨卡病毒和艾滋病病毒的进化方向,为疫苗和药物的快速优化提供了重要支持。

1. 研究背景:病毒变异预测的挑战

病毒的高变异性和突变的随机性,导致有益突变(正样本)极其稀少,这给深度学习模型的训练带来了巨大挑战。此外,病毒突变位点有限,也使得模型难以捕捉微弱的分子内相互作用变化。

2. E2VD框架:创新性设计

为了解决上述难题,研究团队提出了E2VD框架,该框架包含三个主要模块:

  1. 蛋白质序列编码模块:自主训练的定制化蛋白质大语言模型,精准提取病毒蛋白序列特征。

  2. 局部-全局相互作用依赖融合模块:利用卷积神经网络(CNN)和动态注意力机制,捕捉突变与周围氨基酸的相互作用,解决微弱突变效应难以捕获的问题。

  3. 多任务焦点学习模块:结合多任务学习和难样本挖掘策略,特别是设计了新颖的多任务焦点损失函数(Multi-task Focal Loss),提升模型对稀少有益突变的预测能力。

E2VD框架具有灵活的输入输出设计,可以用于多种病毒类型和预测任务,例如结合亲和力、表达量、抗体逃逸能力等。

3. 实验结果:显著提升预测精度和泛化能力

实验结果表明,E2VD在预测有益突变的精度上提升了67%,显著超越了其他主流方法。定制化的蛋白质语言模型在参数量更少的情况下,也取得了优于大型模型ESM2-15B的效果。E2VD还展现出极佳的泛化能力,能够跨病毒类型、跨毒株进行准确预测。

4. E2VD的应用和未来展望

E2VD能够解释病毒进化路径、预测高风险突变,并模拟病毒在真实世界中的进化轨迹。未来,团队计划将E2VD与疫苗和蛋白药物设计流程结合,提高设计效率和可控性,为病毒防治和药物设计带来突破。

5. 团队背景及其他研究成果

该团队在AI for Life Science领域拥有深厚积累,曾获得2022年度“戈登贝尔新冠特别奖”,并在高性能计算应用方面取得了显著成果,例如开发针对SARS-CoV-2 RBD突变模拟的高通量筛选方法以及多用途酶-底物相互作用预测框架MESI。

总而言之,E2VD框架为病毒进化预测提供了强大的工具,为应对未来新发病毒感染提供了重要保障,也为AI在生命科学领域的应用提供了新的范例。


联系作者

文章来源:HyperAI超神经
作者微信:
作者简介:解构技术先进性与普适性,报道更前沿的 AIforScience 案例

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止