受 EleutherAI 的启发,OpenBioML 旨在成为机器学习和生物学交叉域的开放协作研究实验室。从讨论最发展到合作开展尖端项目和复制闭源研究。我们寻求最大限度地发挥人工智能在生命科学中的积极影响。
我们可以访问大规模计算资源,并希望利用它们来加速研究。如果这是您感兴趣的事情,您可以考虑提出一个合作研究项目或通过我们的 discord 参与进来!
该项目的目标是研究最近的扩散模型对基因组学数据的应用和适应。扩散模型是功能大的模型,已用于图像生成(例如稳定扩散、DALL-E)、音乐生成(洋红色项目的最版本)并取得了出色的效果。如果在训练期间提供本或连续/离散标签,则称为“引导”扩散的特定模型公式允许将生成过程偏向特定方向。这允许创建“AI 艺术家”,基于本提示,可以创建美丽而复杂的图像。
我们的任务
大多数研究小组缺乏承担前沿研究项目以及快速迭代想法所需的计算能力。AlphaFold2 最近的成功证明了这一事实:为了训练最终模型,DeepMind 的团队使用了 128 个 TPUv3 数周时间,但这并没有考虑之前为最终架构所使用的所有资源。很少有学术实验室能够获得如此大规模的资源,但很明显,人才和创思想可以在世界各地找到。
激励我们的是可用资源和人才之间的不相称:通过创建一个分散的研究实验室,可以访问以前只有资金最充足的工业研究实验室才能使用的计算和存储资源,我们寻求支持更广泛的社区并激励发布当前技术可以提供的最先进的预测模型。
人们一再明确表示,机器学习模型通常会显示出令人惊讶的涌现能力,而这些能力往往难以预见。例如,AlphaFold2 被发现能够预测四元结构。研究人员在其检查点发布后不久就对该模型进行了实验,发现了这种能力。我们都将从改进的生物技术中获益,如果机器学习越来越成为计算生物学的核心,我们需要确保这些能力得到充分发现和利用。
数据统计
数据评估
本站OpenI提供的OpenBioML都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由OpenI实际控制,在2023年 5月 13日 下午5:15收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,OpenI不承担任何责任。