AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AIGC动态1年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了
关键字：模型,数学,数据,路径,研究人员
文章来源：量子位
内容字数：3203字

内容摘要：

鱼羊发自凹非寺量子位 | 公众号 QbitAI把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。
在MATH数据集上，甚至让7B模型得分超过了GPT-4。
一项来自阿里的新研究引发关注：
研究人员用蒙特卡洛树搜索（MCTS）给大语言模型来了把性能增强，无需人工标注解题步骤，也能生成高质量数据，有效提升大模型的数学成绩。
论文发布，让不少网友重新关注到了蒙特卡洛树搜索这个在前大模型时代的明星算法。
有人直言：
蒙特卡洛树搜索+LLM是通往超级智能之路。
因为“树搜索本身更接近人类思维”。
用蒙特卡洛树搜索增强大模型具体来说，阿里的研究人员提出了一种名为AlphaMath的方法，用大语言模型+MCTS来自动生成数学推理数据，并提升大模型在完成数学推理任务时的性能表现。
嗯，名字就很有蒙特卡洛树搜索内味儿了。
这里有个前情提要：
思维链（CoT）、思维程序（PoT）等方法已经被证明能够有效提高大模型的数学能力，但问题在于，它们都需要人类手动喂详细的解题步骤，即训练当中需要用到人工标注的高质量数学推理数据。
AlphaMath的一个核心目的就在于，在这个步骤中去人工化

原文链接：AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了