检索总结能力超博士后，首个大模型科研智能体PaperQA2开源了

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：检索总结能力超博士后，首个大模型科研智能体PaperQA2开源了
关键字：报告,研究者,问题,论文,文献
文章来源：机器之心
内容字数：0字

内容摘要：

机器之心报道
编辑：泽南、杜伟这是 AI 智能体在大部分科学研究中超越人类的第一个案例，或许会彻底改变人类与科学文献互动的方式。最近一段时间，有关 AI 科学家的研究越来越多。大语言模型（LLM）有望帮助科学家检索、综合和总结文献，提升人们的工作效率，但在研究工作中使用仍然有很多限制。
对于科研来说，事实性至关重要，而大模型会产生幻觉，有时会自信地陈述没有任何现有来源或证据的信息。另外，科学需要极其注重细节，而大模型在面对具有挑战性的推理问题时可能会忽略或误用细节。
最后，目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献，而是局限于摘要、在固定语料库上检索，或者只是直接提供相关论文。这些基准不适合作为实际科学研究任务的性能代理，更重要的是，它们通常缺乏与人类表现的直接比较。因此，语言模型和智能体是否适合用于科学研究仍不清楚。
近日，来自 FutureHouse、罗切斯特大学等机构的研究者们尝试构建一个更为强大的科研智能体，并对 AI 系统和人类在三个现实任务上的表现进行严格比较。这三个任务有关搜索整个文献以回答问题；生成一篇有引用的、风格的科学主题文章；从论文中提取

原文链接：检索总结能力超博士后，首个大模型科研智能体PaperQA2开源了