70亿LLaMA媲美5400亿PaLM！MIT惊人研究用「博弈论」改进大模型｜ICLR 2024

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：70亿LLaMA媲美5400亿PaLM！MIT惊人研究用「博弈论」改进大模型｜ICLR 2024
关键字：模型,生成器,,游戏,答案
文章来源：新智元
内容字数：7970字

内容摘要：

新智元报道编辑：桃子
【新智元导读】大模型回答如何更可靠？MIT研究团队设计出「博弈」，将数学家常用的博弈论引入LLM改进中。没想到，LLaMA-7B的表现，击败了LLaMA-65B，甚至与PaLM-540B相媲美。遇到一个问题用不同表达方式prompt时，大模型往往会给出两种不同的答案。
比如，「秘鲁的首都是什么」，「利马是秘鲁的首都吗」。
对于这种回答不一致的问题，科学家们纷纷为大模型的「智商」担忧起来。
正如了LeCun所言：
LLM确实比狗积累了更多的事实知识和语言能力。但是它们对物理世界的理解能力，以及推理规划能力，远远不及狗。
那么，有没有一种方式，能够大模型幻觉，让结果更加准确、高效？
来自MIT的研究人员，将「博弈论」的思想引入大模型的改进中。
他们共同设计了一个游戏，在游戏中，让模型的两种模式（生成式和判别式）相互对抗，努力找到它们可以达成一致的答案。
这个简单的博弈过程，被称为「博弈」（CONSENSUS GAME）。
也就是，让模型自我对抗，以提升LLM准确性和内部一致性。
论文地址：https://openreview.net/pdf?id=n9x

原文链接：70亿LLaMA媲美5400亿PaLM！MIT惊人研究用「博弈论」改进大模型｜ICLR 2024