AIGC动态欢迎阅读
原标题:打破AlphaFold大模型局限,世界最大蛋白质相互作用数据集AlphaSeq横空出世
关键字:蛋白质,细胞,数据,酵母,模型
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:乔杨
【新智元导读】虽然AlphaFold等系列的大模型已经在蛋白质预测方面取得了前所未有的突破,但依旧无法胜任蛋白质-蛋白质相互作用(PPI)这种复杂的任务。初创公司A-Alpha Bio的PPI数据集AlphaSeq,有望补足这方面的技术短板。随着最近AlphaFold 3和ESM 3的相继推出,我们看到了深度学习在生物学领域的无限潜力。
然而,Dyno Therapeutics的高级机器学习工程师Abihishaike Mahajan在上个月发布的一篇博文中指出了潜在的增长危机。
他认为,AlphaFold系列所取得的成果,即将一个强大的深度学习模型应用于一个已经存在大量数据的领域,从而引发一场彻底的革命——这是极难复制的。
原因还是数据。我们几乎用尽了所有预先存在的数据,未经训练的蛋白质结构和序列正在枯竭,RNA和DNA也是如此。
要想进一步训练模型,发掘更多来源和模态的数据是必不可少的。Mahajan指出,理想情况下,这样的数据应该满足3个条件:
– 具有复杂的潜在分布
– 与重要的生理现象高度相关
– 适合大规模收集
在生物学领域,有很多数据可以满足前两个
原文链接:打破AlphaFold大模型局限,世界最大蛋白质相互作用数据集AlphaSeq横空出世
联系作者
文章来源:新智元
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...