覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

AIGC动态2年前 (2024)发布 HyperAI超神经

AIGC动态欢迎阅读

原标题：覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4
关键字：化学,模型,数据,任务,能力
文章来源：HyperAI超神经
内容字数：0字

内容摘要：

作者：李姝
编辑：李姝，李宝珠
化学大语言模型 ChemLLM 是首个兼备化学专业能力和对话、推理等通用能力的开源大模型。目前 HyperAI超神经官网 (hyper.ai) 已上线「一键部署化学大模型 ChemLLM-7B-chat」，详细教程详见下文。随着人工智能技术的飞速发展，大语言模型 (LLMs) 凭借其强大的自然语言处理能力，在生命科学、海洋学、材料化学等科学研究中被广泛应用。虽然，LLMs 在分子特性预测、分子生成和实验方案设计等化学相关任务上表现良好，但在处理各种化学下游任务时表现欠佳。
究其原因，直接将化学知识集成到语言模型中，主要面临三大挑战：首先，大多数化学信息和知识存储在结构化数据库中，直接使用这些数据训练 LLMs 可能会损害模型处理自然语言的能力，使得模型的对话和逻辑推理能力发生退化；其次，在化学信息学中，分子用特殊符号表示，如 SMILES。然而这类数据往往不符合自然语言的规范，因此常规的语言模型难以正确理解和生成这种符号；最后，化学数据和任务种类繁多，设计一个灵活并能泛化到多种化学任务上的训练流程十分困难。
针对于此，上海人工智能实验室发布了化学大语言模

原文链接：覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4