浅谈OpenAI最新发布的o1大模型：RL深度思考，技术差距拉开

AIGC动态2年前 (2024)发布智猩猩GenAI

AIGC动态欢迎阅读

原标题：浅谈OpenAI最新发布的o1大模型：RL深度思考，技术差距拉开
关键字：知乎,模型,奥林匹克,思维,能力
文章来源：智猩猩GenAI
内容字数：0字

内容摘要：

openai放大招了，是奥特曼在推上宣传了很久的草莓真身，这次它真的来了。又给大家带来一点小小的震撼，国内大模型老板们也不再迷茫了，4o的多模态的还没赶上呢，这下怎么又回到纯文本了，不是说大家都搞得差不多了吗？
奥特曼表示，虽然 o1 的表现仍然存在缺陷，不过你在第一次使用它的时候仍然会感到震撼。这对从业者绝对是一件大好事，老板们发现饼还比较大，还可以让资本继续投钱，百万洗数据槽工衣食所系！
直接延长了从愚昧之巅到绝望之谷的到来。01OpenAI o1到底有多强？这次发布的大模型主要针对的任务是复杂任务推理，比如竞赛难度的编程问题，奥赛难度的数学问题等。并且效果得到了极大的提升，大概从高中生提升到了博士生。比如写代码的水平：该模型在 2024 年国际信息学奥林匹克竞赛（IOI）赛题上得到了 213 分，达到了排名前 49% 的水平。在最难的数学，code，物理化学生物等benchmark上遥遥领先。在全美高中生数学竞赛AIME上，o1能达到74分（GPT4-o仅有12分），如果采样1000次，结合reward model加权投票能到93分，能排进全国前500名，超过USA Mathem

原文链接：浅谈OpenAI最新发布的o1大模型：RL深度思考，技术差距拉开