o3 mini版将在1月底推出,之后不久推出o3完整版。
原标题:OpenAI最强推理模型o3发布!AGI测试能力暴涨,最难数学测试分数碾压同行
文章来源:智东西
内容字数:6462字
OpenAI发布o3模型:迈向通用人工智能的新阶段
2023年12月21日,OpenAI在其“连续12日圣诞发布”活动中推出了重磅新品o3,标志着AI技术的又一重大进步。OpenAI CEO Sam Altman表示,o3在某些条件下接近通用人工智能(AGI),并强调其在复杂推理任务中的强大能力。
1. o3模型的特点
o3继承了前代o1模型的思维链机制,能够逐步解释其逻辑推理过程,得出最准确的答案。新版本包括mini版和完整版,mini版将于2024年1月底推出。o3的推理时间可调节为低、中、高,推理效果随时间提升而增强。
2. 性能测试与评估
在ARC-AGI测试中,o3在高推理能力设置下取得了87.5%的分数,显著超过o1的成绩。o3的能力在多个基准测试中表现优异,例如在SWE-Bench Verified中,准确率高达71.7%。此外,o3在编程竞赛平台Codeforces中得分达2727,展示出其卓越的编程能力。
3. 安全性与对齐策略
OpenAI还提出了“审议对齐”训练方法,旨在提升模型的安全性。该方法通过明确的安全规范引导模型推理,避免了传统训练方法的局限性。研究显示,o3在多个安全基准测试中表现优于其他竞争模型,显示出其在安全性方面的优势。
4. 未来展望
OpenAI计划与ARC-AGI基金会合作,构建新的基准测试,进一步推动AI技术的发展。尽管o3系列模型的发布尚需时间,但其性能和潜力吸引了全球的关注,预示着通往AGI的竞赛正在加速进行。
总之,o3模型的推出不仅是OpenAI技术进步的体现,更为未来的AI发展奠定了基础,值得期待。
联系作者
文章来源:智东西
作者微信:
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。