OpenAI o4-mini

OpenAI o4-mini – OpenAI推出的小型推理模型

OpenAI o4-mini

OpenAI o4-mini是什么

OpenAI o4-mini 是 OpenAI 最新推出的小型推理模型，专注于快速且经济高效的推理能力。该模型在数学、编程和视觉任务上表现卓越，在 AIME 2024 和 2025 的基准测试中名列前茅。OpenAI o4-mini 具备强大的高容量和高吞吐量推理能力，非常适合迅速处理大量问题。它还具备多模态能力，能够将图像与信息链结合进行推理，并支持工具使用，快速生成详尽且深思熟虑的答案。与前代模型相比，OpenAI o4-mini 在性能和性价比上均有显著提升。目前，ChatGPT Plus、Pro 和 Team 用户可以在模型选择器中找到 OpenAI o4-mini 和 OpenAI o4-mini-high，取代了以往的 o1、o3-mini 和 o3-mini-high，而 ChatGPT Enterprise 和 Edu 用户将在一周内获得访问权限。开发者也可通过 Chat Completions API 和 Responses API 使用该模型。

OpenAI o4-mini的主要功能

快速推理：擅长迅速处理数学、编程和视觉任务，特别适合高吞吐量的应用场景。
多模态能力：能够将图像与文本结合进行推理，支持图像处理功能。
工具使用：可调用网络搜索、Python 编程等工具，帮助解决复杂问题。
高性价比：在性能上优于前代 o3-mini，价格保持不变，是升级的理想选择。
安全可靠：经过安全训练，可以有效拒绝不当请求。

OpenAI o4-mini的性能表现

数学推理：在 AIME 2024 和 2025 的基准测试中，OpenAI o4-mini 在不开启工具的情况下准确率高达 93.4%，接入 Python 后准确率更是提升至 98.7%，接近满分。在解决复杂数学问题时，OpenAI o4-mini 的表现超过了前代 o3-mini，并在某些任务中接近完整版 o3。
编程能力：
- SWE-Lancer：OpenAI o4-mini 在此领域表现优异，能够高效完成复杂编程任务，取得良好的收益。
- SWE-Bench Verified（软件工程题库）：在常见算法、系统设计和 API 调用等任务中，OpenAI o4-mini 的表现卓越，准确率和效率均高于 o3-mini。
- Aider Polyglot Code Editing（多语言代码编辑基准）：在代码编辑任务中，OpenAI o4-mini 表现出色，包括整体重写和补丁式修改，均优于 o3-mini。
多模态能力：
- MMMU（大学水平的视觉数学题库）：OpenAI o4-mini 能够将图像与数学符号结合解题，准确率达到 87.5%，远超前代 o1 的 71.8%。
- MathVista（视觉数学推理）：在几何图形和函数曲线等视觉数学推理任务中，OpenAI o4-mini 的准确率高达 87.5%。
- CharXiv-Reasoning（科学图表推理）：OpenAI o4-mini 能够理解科学论文中的图表和示意图，准确率达到 75.4%，显著优于 o1 的 55.1%。
工具使用：
- Scale MultiChallenge（多轮指令遵循）：OpenAI o4-mini 能够处理复杂的多轮指令任务，准确理解并执行指令。
- BrowseComp Agentic Browsing（浏览器任务）：在基于虚拟浏览器的搜索、点击和信息整合中，表现接近 o3，远超传统 AI 搜索能力。
- Tau-bench 函数调用：在函数调用任务中表现稳定，能够准确生成结构化的 API 调用，但在复杂场景下仍需进一步优化。
综合测试：
- 专家级综合测试（Humanity’s Last Exam）：在不开启工具的情况下准确率为 14.3%，借助插件后提升至 17.7%，虽然不及 o3 的 24.9%，但在小型模型中表现依然出色。
- 跨学科 PhD 级科学题（GPQA Diamond）：在科学题上的准确率为 81.4%，略低于 o3 的 83.3%，但在小型模型中表现已相当出色。

OpenAI o4-mini的项目地址

项目官网：https://openai.com/index/introducing-o4-mini/

OpenAI o4-mini的应用场景

教育辅导：帮助学生解决数学和编程问题。
数据分析：快速生成数据图表和分析结果。
软件开发：生成代码片段，辅助代码调试。
内容创作：提供创意灵感，结合图像生成描述。
日常查询：基于搜索和图像分析回答问题。

常见问题

OpenAI o4-mini适合哪些用户？：OpenAI o4-mini非常适合需要快速推理和高效问题解决的用户，如学生、工程师和数据分析师。
如何访问OpenAI o4-mini？：ChatGPT Plus、Pro 和 Team 用户可以通过模型选择器访问 OpenAI o4-mini，而 ChatGPT Enterprise 和 Edu 用户将在一周内获得权限。
OpenAI o4-mini的安全性如何？：该模型经过安全训练，能够有效处理不当请求，保障用户的使用安全。

阅读原文