小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law
关键字：模型,测试,方法,草莓,策略
文章来源：量子位
内容字数：0字

内容摘要：

西风发自凹非寺量子位 | 公众号 QbitAI不必增加模型参数，计算资源相同，小模型性能超过比它大14倍的模型！
谷歌DeepMind最新研究引发热议，甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。
研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。
结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。
换句话说，在预训练阶段花费更少的计算资源，而在推理阶段花费更多，这种策略可能更好。
推理时用额外计算来改进输出这项研究的核心问题是——
在一定计算预算内解决prompt问题，不同的计算策略对于不同问题的有效性有显著差异。我们应如何评估并选择最适合当前问题的测试时计算策略？这种策略与仅仅使用一个更大的预训练模型相比，效果如何？
DeepMind研究团队探究了两种主要机制来扩展测试时的计算。
一种是针对基于过程的密集验证器奖励模型（PRM）进行搜索。
PRM可以在模型生成答案过程中的每个步骤都提供评分，用于引导搜索算法，动态调整搜索策略，通过在生成过程中识别错误或低效的路径，帮助避免在

原文链接：小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law