张俊林：OpenAI o1的价值意义及强化学习的Scaling Law

AIGC动态欢迎阅读

原标题：张俊林：OpenAI o1的价值意义及强化学习的Scaling Law
关键字：模型,能力,逻辑推理,数据,方向
文章来源：机器之心
内容字数：0字

内容摘要：

机器之心转载
作者：新浪新技术研发负责人张俊林蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。
一、OpenAI o1 是大模型的巨大进步
我觉得 OpenAI o1 是自 GPT 4 发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT 4o 和 o1 是发展大模型不同的方向，但是 o1 这个方向更根本，重要性也比 GPT 4o 这种方向要重要得多，原因下面会分析。
为什么说 o1 比 4o 方向重要？
这是两种不同的大模型发展思路，说实话在看到 GPT 4o 发布的时候我是有些失望的，我当时以为 OpenAI 会优先做 o1 这种方向，但是没想到先出了 GPT 4o。GPT 4o 本质上是要探索不同模态相互融合的大一统模型应该怎么做的问题，对于提升大模型的智力水平估计帮助不大；而 o1 本质上是在探索大模型在 AGI 路上能走多远、天花板在哪里的问题，很明显第二个问题更重要。
GPT 4o 的问题在于本身大模型的智力水平还不够高，所以做不了复杂任务，导致很多应用场景无法实用化，而指望靠图片、视频这类新模态数据大幅提升大模

原文链接：张俊林：OpenAI o1的价值意义及强化学习的Scaling Law