「think step by step」还不够，让模型「think more steps」更有用

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：「think step by step」还不够，让模型「think more steps」更有用
关键字：研究者,步骤,问题,模型,样本
文章来源：机器之心
内容字数：8828字

内容摘要：

机器之心报道
机器之心编辑部本文对思维链的推理步长进行了控制变量实验，发现推理步长和答案的准确性是线性相关的，这种影响机制甚至超越了问题本身所产生的差异。如今，大型语言模型（LLM）及其高级提示策略的出现，标志着对语言模型的研究取得了重大进展，尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链（CoT）提示技术，该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理，在各种挑战中表现出了优秀的性能，其中包括跨域、长泛化和跨语言的任务。CoT 及其富有逻辑的、循序渐进的推理方法，在复杂的问题解决场景中提供了至关重要的可解释性。
尽管 CoT 取得了长足的进展，但研究界尚未就 CoT 及其变体的具体机制和有效原因达成。这种知识差距意味着提高 CoT 性能仍是一个探索领域。而这种探索主要依赖于试错，因为目前还缺乏改进 CoT 效果的系统性方，研究人员只能依赖猜测和实验。但是这也同时表明该领域存在着重要的研究机遇：对 CoT 的内部运作形成更深入、更结构化的理解。如果实现这个目标，不仅能揭开当前 CoT 过程的神秘面纱，还能为在各种复杂的 NLP 任务中更可靠

原文链接：「think step by step」还不够，让模型「think more steps」更有用