70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

AIGC动态6个月前发布 新智元
14 0 0

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

AIGC动态欢迎阅读

原标题:70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024
关键字:模型,生成器,共识,游戏,答案
文章来源:新智元
内容字数:7970字

内容摘要:


新智元报道编辑:桃子
【新智元导读】大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-540B相媲美。遇到一个问题用不同表达方式prompt时,大模型往往会给出两种不同的答案。
比如,「秘鲁的首都是什么」,「利马是秘鲁的首都吗」。
对于这种回答不一致的问题,科学家们纷纷为大模型的「智商」担忧起来。
正如了LeCun所言:
LLM确实比狗积累了更多的事实知识和语言能力。但是它们对物理世界的理解能力,以及推理规划能力,远远不及狗。
那么,有没有一种方式,能够破解大模型幻觉,让结果更加准确、高效?
来自MIT的研究人员,将「博弈论」的思想引入大模型的改进中。
他们共同设计了一个游戏,在游戏中,让模型的两种模式(生成式和判别式)相互对抗,努力找到它们可以达成一致的答案。
这个简单的博弈过程,被称为「共识博弈」(CONSENSUS GAME)。
也就是,让模型自我对抗,以提升LLM准确性和内部一致性。
论文地址:https://openreview.net/pdf?id=n9x


原文链接:70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

联系作者

文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...