GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

AIGC动态1个月前发布 新智元
318 0 0

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

原标题:GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
文章来源:新智元
内容字数:7208字

GPT-4.5:OpenAI的“失败”之作还是另有隐情?

近日,OpenAI发布的GPT-4.5引发了广泛争议,不少人将其评价为“失败之作”,甚至认为OpenAI已失去护城河。本文将对GPT-4.5的评价进行梳理,并探讨其背后的原因。

1. GPT-4.5的“失败”:性能与成本的矛盾

众多评测结果显示,GPT-4.5的性能并未超越GPT-4,甚至在一些基准测试中表现更差。一些权威人士如纽约大学教授马库斯,直接将其斥为“空心汉堡”。更有AI初创公司CEO指出,GPT-4.5的成本是DeepSeek V3的500倍,性能却不如后者。这引发了人们对OpenAI成本效益的质疑,以及其技术领先地位是否依然稳固的担忧。

2. OpenAI的回应:Scaling Law的继续

面对外界的批评,OpenAI首席研究官Mark Chen表示,GPT-4.5是团队在无监督学习上的最新扩展实验,证明了Scaling Law的有效性,并代表着模型规模迈入了新的发展阶段。他强调,GPT-4.5的开发并非一帆风顺,但其在某些方面仍有改进,例如在创意写作等领域表现优于推理模型,并且在用户体验上也得到了提升。

3. 多方竞争加剧:OpenAI面临挑战

除了GPT-4.5自身的争议,OpenAI还面临着来自DeepSeek、xAI Grok 3、Anthropic等竞争对手的压力。DeepSeek的开源策略和价格战,进一步压缩了大模型的利润空间。这使得OpenAI的先发优势不再明显,其商业模式也面临挑战。

4. 技术路线之争:预训练与推理的并行

OpenAI目前正同时探索预训练和推理两种技术路线。GPT-4.5代表了对预训练的继续投入,而OpenAI也承认推理能力的提升同样重要。两种方法并非相互排斥,而是相辅相成的,预训练提供知识基础,推理则在此基础上进行更高级的思考。

5. OpenAI的未来:挑战与机遇并存

GPT-4.5的发布引发了对OpenAI的诸多质疑,其高昂的成本和相对有限的性能提升,使其面临着巨大的商业压力。然而,OpenAI仍在持续探索大模型的可能性,并积极寻求技术突破。其未来发展,将取决于能否在技术创新和商业模式上找到平衡点。

总而言之,GPT-4.5的发布并非一面倒的失败,而是引发了对大模型发展方向和商业模式的深刻反思。OpenAI的未来,将取决于其能否应对激烈的市场竞争,并持续推动人工智能技术的发展。


联系作者

文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...