AIGC动态欢迎阅读
原标题:Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
关键字:企鹅,任务,模板,思维,问题
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:Aeneas 好困
【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大语言模型不擅长推理怎么办?
用思维缓冲区(Buffer of Thoughts,BoT)来解决!
最近,北大、UC伯克利、斯坦福的研究人员提出了一种元缓冲区(meta-buffer)。它可以存储一系列信息丰富的高级思维,也就是所谓的「思维模板」,它是从各种任务的问题解决过程中蒸馏出来的。
论文地址:https://arxiv.org/abs/2406.04271
然后,对于每个问题,都可以检索相关的思维模板,然后用特定的推理结构让它自适应,这样就可以进行有效的推理了!
在以往,24点游戏(Game of 24)、几何图形任务(Geometric Shapes)、一步将死问题(Checkmate-in-One)这些推理密集型任务,难倒了不少LLM。
24点游戏
而使用思维缓冲区(BoT)后,与之
原文链接:Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。