比人类便宜20倍！谷歌DeepMind推出「超人」AI系统

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：比人类便宜20倍！谷歌DeepMind推出「超人」AI系统
关键字：模型,事实,人类,事实性,研究人员
文章来源：新智元
内容字数：4413字

内容摘要：

新智元报道编辑：alan
【新智元导读】大模型的幻觉问题怎么解？谷歌DeepMind：用AI来做同行评审！事实核验正确率超过人类，而且便宜20倍。AI的同行评审来了！
一直以来，大语言模型胡说八道（幻觉）的问题最让人头疼，而近日，来自谷歌DeepMind的一项研究引发网友热议：
大模型的幻觉问题，好像被终结了？
论文地址：https://arxiv.org/pdf/2403.18802.pdf
项目地址：https://github.com/google-deepmind/long-form-factuality
在这篇工作中，研究人员介绍了一种名为 “搜索增强事实性评估器”（Search-Augmented Factuality Evaluator，SAFE）的方法。
对于LLM的长篇回答，SAFE使用其他的LLM，将答案文本分解为单个叙述，然后使用诸如RAG等方法，来确定每个叙述的准确性。
——简单来说就是：AI答题，AI判卷，AI告诉AI你这里说的不对。
真正的「同行」评审。
另外，研究还发现，相比于人工标注和判断事实准确性，使用AI不但便宜20倍，而且还更靠谱！
目前这个项目

原文链接：比人类便宜20倍！谷歌DeepMind推出「超人」AI系统