OpenAI满血版o1剧透:数学代码能力再破天花板,已开启测试评估

AIGC动态1个月前发布 量子位
8 0 0

OpenAI满血版o1剧透:数学代码能力再破天花板,已开启测试评估

AIGC动态欢迎阅读

原标题:OpenAI满血版o1剧透:数学代码能力再破天花板,已开启测试评估
关键字:报告,模型,系列,产品,更多
文章来源:量子位
内容字数:0字

内容摘要:


一水 发自 凹非寺量子位 | 公众号 QbitAI“性能远超o1预览版,满血版o1即将推出”。
OpenAI在官网商业化频道下,对满血版o1来了一波提前剧透。
视频截图中,满血版o1和GPT-4o、o1-preview(预览版)同台竞技,且在数学/编码上遥遥领先。
经透露,OpenAI将同步发布GPT系列和o1系列,且正在对满血版o1进行基准测试和运行评估。
此外,官方计划在未来几个月内为o1系列模型添加更多功能,例如网页浏览、文件和图像上传等,并支持ChatGPT自动选择合适模型。
不过扫到最后,网友们却发现了一个华点:
啥?在PhD级别的科学任务上,满血版o1竟打不过o1-preview?
对于这点,我们不妨从OpenAI首席产品官最近的采访中找找答案,刚好他也谈到了o1模型——
满血版o1即将推出OpenAI于上月无预警发布了传说中的“草莓”模型:o1系列。
它是OpenAI首个经过强化学习训练的模型,在输出回答之前,会再产生一个很长的思维链,以此增强模型的能力。
o1系列一共3档,满血版因过于强大至今仍未公布。
o1(满血版):新的大模型天花板,专注于深度思考和逻辑推理
o1-


原文链接:OpenAI满血版o1剧透:数学代码能力再破天花板,已开启测试评估

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...