覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4

覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4

AIGC动态欢迎阅读

原标题:覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4
关键字:化学,模型,数据,任务,能力
文章来源:HyperAI超神经
内容字数:0字

内容摘要:


作者:李姝
编辑:李姝,李宝珠
化学大语言模型 ChemLLM 是首个兼备化学专业能力和对话、推理等通用能力的开源大模型。目前 HyperAI超神经官网 (hyper.ai) 已上线「一键部署化学大模型 ChemLLM-7B-chat」,详细教程详见下文。随着人工智能技术的飞速发展,大语言模型 (LLMs) 凭借其强大的自然语言处理能力,在生命科学、海洋学、材料化学等科学研究中被广泛应用。虽然,LLMs 在分子特性预测、分子生成和实验方案设计等化学相关任务上表现良好,但在处理各种化学下游任务时表现欠佳。
究其原因,直接将化学知识集成到语言模型中,主要面临三大挑战:首先,大多数化学信息和知识存储在结构化数据库中,直接使用这些数据训练 LLMs 可能会损害模型处理自然语言的能力,使得模型的对话和逻辑推理能力发生退化;其次,在化学信息学中,分子用特殊符号表示,如 SMILES。然而这类数据往往不符合自然语言的规范,因此常规的语言模型难以正确理解和生成这种符号;最后,化学数据和任务种类繁多,设计一个灵活并能泛化到多种化学任务上的训练流程十分困难。
针对于此,上海人工智能实验室发布了化学大语言模


原文链接:覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4

联系作者

文章来源:HyperAI超神经
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...