浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开

浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开

AIGC动态欢迎阅读

原标题:浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开
关键字:知乎,模型,奥林匹克,思维,能力
文章来源:智猩猩GenAI
内容字数:0字

内容摘要:


openai放大招了,是奥特曼在推上宣传了很久的草莓真身,这次它真的来了。又给大家带来一点小小的震撼,国内大模型老板们也不再迷茫了,4o的多模态的还没赶上呢,这下怎么又回到纯文本了,不是说大家都搞得差不多了吗?
奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。这对从业者绝对是一件大好事,老板们发现饼还比较大,还可以让资本继续投钱,百万洗数据槽工衣食所系!
直接延长了从愚昧之巅到绝望之谷的到来。01OpenAI o1到底有多强?这次发布的大模型主要针对的任务是复杂任务推理,比如竞赛难度的编程问题,奥赛难度的数学问题等。并且效果得到了极大的提升,大概从高中生提升到了博士生。比如写代码的水平:该模型在 2024 年国际信息学奥林匹克竞赛(IOI)赛题上得到了 213 分,达到了排名前 49% 的水平。在最难的数学,code,物理化学生物等benchmark上遥遥领先。在全美高中生数学竞赛AIME上,o1能达到74分(GPT4-o仅有12分),如果采样1000次,结合reward model加权投票能到93分,能排进全国前500名,超过USA Mathem


原文链接:浅谈OpenAI最新发布的o1大模型:RL深度思考,技术差距拉开

联系作者

文章来源:智猩猩GenAI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...