小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

AIGC动态欢迎阅读

原标题:小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law
关键字:模型,测试,方法,草莓,策略
文章来源:量子位
内容字数:0字

内容摘要:


西风 发自 凹非寺量子位 | 公众号 QbitAI不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型!
谷歌DeepMind最新研究引发热议,甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。
研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。
结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。
换句话说,在预训练阶段花费更少的计算资源,而在推理阶段花费更多,这种策略可能更好。
推理时用额外计算来改进输出这项研究的核心问题是——
在一定计算预算内解决prompt问题,不同的计算策略对于不同问题的有效性有显著差异。我们应如何评估并选择最适合当前问题的测试时计算策略?这种策略与仅仅使用一个更大的预训练模型相比,效果如何?
DeepMind研究团队探究了两种主要机制来扩展测试时的计算。
一种是针对基于过程的密集验证器奖励模型(PRM)进行搜索。
PRM可以在模型生成答案过程中的每个步骤都提供评分,用于引导搜索算法,动态调整搜索策略,通过在生成过程中识别错误或低效的路径,帮助避免在


原文链接:小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...