OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌

OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌

AIGC动态欢迎阅读

原标题:OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌
关键字:报告,知识产权,人工智能,政策,华为
文章来源:人工智能学家
内容字数:0字

内容摘要:


来源:AI寒武纪
OpenAI的研究员Jason Wei(o1思维链核心开发人员)点出了一个关键但容易被忽视的问题:思维链在o1出现前后发生了巨大的变化,虽然只是名称上多了个”o1″,但这背后的含义却远不止如此
o1之前:模仿秀,不是真思考在o1范式出现之前(即思维链提示的早期阶段),思维链的实际运作方式与我们期望的之间存在着很大的差异。我们希望思维链能够反映模型真正的思考过程,但实际上,模型只是在模仿它在预训练数据中看到的推理路径,例如数学作业的解答。
这类数据的最大问题在于,它们是事后诸葛亮式的总结,作者在其他地方完成了所有思考过程后才写下的答案,而不是真正的思维过程记录。因此,这些答案的信息密度往往很低,一个极端的例子就是“答案是5,因为……”,其中“5”这个词承载了几乎所有的新信息量,而前面的铺垫却冗长而低效
o1之后:内心独白,信息量爆炸o1范式出现后,你会发现思维链看起来与教科书式的数学解答截然不同。这些思维链更像是模型的“内心独白”或“意识流”。你会看到模型进行回溯、修正,它会说“或者,让我们试试……”、“等等,但是……”之类的话,体现了真正的思考和探索过程
Jason


原文链接:OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌

联系作者

文章来源:人工智能学家
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...