高质AI推理模型走向普及。
原标题:重磅!OpenAI推o3-mini新模型,被DeepSeek逼急?定价仍打不过
文章来源:智东西
内容字数:6265字
OpenAI发布全新推理模型o3-mini:性价比之王,挑战DeepSeek
近日,OpenAI发布了其最新推理模型o3-mini,并将其应用于ChatGPT和API。这款模型被OpenAI誉为其最具成本效益的推理模型,在科学、数学、编程等领域性能显著提升,同时保持了低成本和低延迟的特点,并支持联网搜索功能。
1. **o3-mini的主要改进:** o3-mini在多个方面超越了前代模型o1-mini。其在科学、数学、编程基准测试中的得分均有显著提高,例如在GPQA Diamond(理化生)、AIME 2022-2024(数学)、Codeforces ELO(编程)基准测试中分别取得了0.77、0.80、2036的高分。此外,其响应速度也提升了24%,平均响应时间缩短至7.7秒。 o3-mini还提供低、中、高三个推理能力版本,以满足不同用户的需求。高推理能力版本在FrontierMath测试中表现出色,首次尝试便解决了超过32%的问题。
2. **安全性和成本:** OpenAI声称o3-mini在多个安全评估中超越了GPT-4o,在具有挑战性的安全性和越狱评估方面表现突出。 尽管OpenAI宣称每个token的价格已降低95%,但o3-mini的API定价仍然高于DeepSeek模型。 据报道,OpenAI可能已花费超过3000万美元对o3进行基准测试,这凸显了其模型开发的高昂成本。
3. **商业策略和融资:** o3-mini的发布被认为是OpenAI应对DeepSeek等低成本高性能开源模型的策略之一。 OpenAI正计划进行新一轮高达400亿美元的融资,日本软银集团有望成为领投方,这将成为软银迄今为止最大的投资之一。 这一举动也反映了OpenAI在追求高性能的同时,也致力于提升模型的性价比,使高质量的AI更加普及。
4. **o3-mini的应用:** o3-mini已在ChatGPT和API中可用,企业版访问权限也将很快推出。 它目前不支持视觉功能,开发者仍需使用o1进行视觉推理任务。 o3-mini在Chat Completions API、Assistants API、Batch API中均已推出。
5. **总结:** o3-mini的发布标志着OpenAI在高性价比AI模型领域迈出了重要一步。 它在性能、成本和安全性方面取得了显著进展,但其高昂的研发成本和与DeepSeek的竞争也引人关注。 未来,高性价比AI推理模型的普及将对AI产业产生深远的影响。
联系作者
文章来源:智东西
作者微信:
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。