颠覆想象！OpenAI最新o3模型在AGI测试中展现惊人数学实力，同行望尘莫及！

o3 mini版将在1月底推出，之后不久推出o3完整版。

原标题：OpenAI最强推理模型o3发布！AGI测试能力暴涨，最难数学测试分数碾压同行
文章来源：智东西
内容字数：6462字

2023年12月21日，OpenAI在其“连续12日圣诞发布”活动中推出了重磅新品o3，标志着AI技术的又一重大进步。OpenAI CEO Sam Altman表示，o3在某些条件下接近通用人工智能（AGI），并强调其在复杂推理任务中的强大能力。

o3继承了前代o1模型的思维链机制，能够逐步解释其逻辑推理过程，得出最准确的答案。新版本包括mini版和完整版，mini版将于2024年1月底推出。o3的推理时间可调节为低、中、高，推理效果随时间提升而增强。

在ARC-AGI测试中，o3在高推理能力设置下取得了87.5%的分数，显著超过o1的成绩。o3的能力在多个基准测试中表现优异，例如在SWE-Bench Verified中，准确率高达71.7%。此外，o3在编程竞赛平台Codeforces中得分达2727，展示出其卓越的编程能力。

OpenAI还提出了“审议对齐”训练方法，旨在提升模型的安全性。该方法通过明确的安全规范引导模型推理，避免了传统训练方法的局限性。研究显示，o3在多个安全基准测试中表现优于其他竞争模型，显示出其在安全性方面的优势。

OpenAI计划与ARC-AGI基金会合作，构建新的基准测试，进一步推动AI技术的发展。尽管o3系列模型的发布尚需时间，但其性能和潜力吸引了全球的关注，预示着通往AGI的竞赛正在加速进行。

总之，o3模型的推出不仅是OpenAI技术进步的体现，更为未来的AI发展奠定了基础，值得期待。

文章来源：智东西
作者微信：
作者简介：智能产业新媒体！智东西专注报道人工智能主导的前沿技术发展，和技术应用带来的千行百业产业升级。聚焦智能变革，服务产业升级。

文章版权归作者所有，未经允许请勿转载。

暂无评论...