Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神
关键字：企鹅,任务,模板,思维,问题
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：Aeneas 好困
【新智元导读】24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法，用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下，竟多次超越Llama3-70B！大语言模型不擅长推理怎么办？
用思维缓冲区（Buffer of Thoughts，BoT）来解决！
最近，北大、UC伯克利、斯坦福的研究人员提出了一种元缓冲区（meta-buffer）。它可以存储一系列信息丰富的高级思维，也就是所谓的「思维模板」，它是从各种任务的问题解决过程中蒸馏出来的。
论文地址：https://arxiv.org/abs/2406.04271
然后，对于每个问题，都可以检索相关的思维模板，然后用特定的推理结构让它自适应，这样就可以进行有效的推理了！
在以往，24点游戏（Game of 24）、几何图形任务（Geometric Shapes）、一步将死问题（Checkmate-in-One）这些推理密集型任务，难倒了不少LLM。
24点游戏
而使用思维缓冲区（BoT）后，与之

原文链接：Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神