物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，我们已进入RL黄金时代

AIGC动态2年前 (2025)发布机器之心

这下实锤领先了？

原标题：物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，我们已进入RL黄金时代
文章来源：机器之心
内容字数：6285字

DeepSeek R1：搅动AI格局的“神秘东方力量”

近日，一款名为DeepSeek R1的开源AI大模型横空出世，在国内外AI圈引发巨大震动。其强大的性能，特别是无需监督训练的纯强化学习路线，以及堪比OpenAI o1的思维链能力，让业界为之侧目，甚至有人惊呼“游戏结束”。

1. R1的惊艳表现与质疑声

DeepSeek R1在各项基准测试中表现出色，尤其是在一个模拟弹跳球的测试中完胜OpenAI的o1 pro，后者每月收费200美元。该测试要求AI编写Python脚本，模拟黄色球体在一个旋转的正方形内弹跳，并确保球体始终在正方形内。R1精准完成了任务，而其他一些模型，如Anthropic的Claude 3.5 Sonnet和谷歌的Gemini 1.5 Pro，则出现了物理原理判断错误。虽然部分模型如GPT-4o和Gemini 2.0也通过了测试，但R1的表现依然令人印象深刻。然而，R1的卓越性能也引发了一些质疑：它除了跑赢基准测试，真的能领先吗？其“自建模拟物理规律”的能力是否真实可信？

2. DeepSeek：新的“硅谷神话”？

DeepSeek的崛起，让硅谷的AI公司如临大敌。Meta员工正在疯狂分析DeepSeek的技术，试图复制其成功经验；Scale AI创始人Alexandr Wang则认为DeepSeek的模型性能与美国最好的模型相当，并表示这可能会改变AI竞赛的格局。一些分析认为，DeepSeek的成功并非偶然。其拥有超过一万块甚至可能高达五万块的GPU，并且只从中国排名前三的大学招聘人才，展现出强大的资源实力和人才储备。此外，中国科技公司可能享有的补贴也降低了DeepSeek的研发成本。

3. 开源的力量与未来展望

DeepSeek R1的成功，也让业界重新审视开源AI模型的潜力。Hyperbolic的CTO Yuchen Jin指出，DeepSeek R1证明了开源AI与闭源AI的差距不到6个月，中国正在主导开源AI竞赛，强化学习正进入黄金时代，蒸馏模型也展现出强大的力量。 Meta首席人工智能科学家Yann LeCun则认为，DeepSeek的成功并非中国超越美国AI的证据，而是开源模型正在超越专有模型的体现。他强调了开放研究和开源社区的重要性，DeepSeek正是受益于Meta的PyTorch和Llama等开源项目。

4. 持续的竞争与未知的未来

DeepSeek的出现，引发了AI行业激烈的竞争。Meta正在加大投资建设数据中心，其他公司也在摩拳擦掌。虽然目前DeepSeek主要是在对现有模型的快速跟进，但其迅速的研发进度和对人才的培养，使其具备了强大的竞争力。未来谁将最终胜出仍是未知数，但DeepSeek的崛起无疑为AI领域注入了新的活力，也为全球AI格局带来了新的变数。同时，人们对新技术的兴奋之余，也对未来发展抱有谨慎的思考。

联系作者

文章来源：机器之心
作者微信：
作者简介：专业的人工智能媒体和产业服务平台

阅读原文

# AIGC动态 # AI暴击 # Claude对比 # DeepSeekR1 # RLHF # 大型语言模型性能测试

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，我们已进入RL黄金时代

这下实锤领先了？

DeepSeek R1：搅动AI格局的“神秘东方力量”

1. R1的惊艳表现与质疑声

2. DeepSeek：新的“硅谷神话”？

3. 开源的力量与未来展望

4. 持续的竞争与未知的未来

联系作者

除了 S25 手机，三星发布会还公开了首款头显，外观很眼熟，AI 是亮点

年末重磅！ByteDance Research视频理解大模型「眼镜猴」正式发布

相关文章

暂无评论