这下实锤领先了?
原标题:物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代
文章来源:机器之心
内容字数:6285字
DeepSeek R1:搅动AI格局的“神秘东方力量”
近日,一款名为DeepSeek R1的开源AI大模型横空出世,在国内外AI圈引发巨大震动。其强大的性能,特别是无需监督训练的纯强化学习路线,以及堪比OpenAI o1的思维链能力,让业界为之侧目,甚至有人惊呼“游戏结束”。
1. R1的惊艳表现与质疑声
DeepSeek R1在各项基准测试中表现出色,尤其是在一个模拟弹跳球的测试中完胜OpenAI的o1 pro,后者每月收费200美元。该测试要求AI编写Python脚本,模拟黄色球体在一个旋转的正方形内弹跳,并确保球体始终在正方形内。R1精准完成了任务,而其他一些模型,如Anthropic的Claude 3.5 Sonnet和谷歌的Gemini 1.5 Pro,则出现了物理原理判断错误。虽然部分模型如GPT-4o和Gemini 2.0也通过了测试,但R1的表现依然令人印象深刻。 然而,R1的卓越性能也引发了一些质疑:它除了跑赢基准测试,真的能领先吗?其“自建模拟物理规律”的能力是否真实可信?
2. DeepSeek:新的“硅谷神话”?
DeepSeek的崛起,让硅谷的AI公司如临大敌。Meta员工正在疯狂分析DeepSeek的技术,试图复制其成功经验;Scale AI创始人Alexandr Wang则认为DeepSeek的模型性能与美国最好的模型相当,并表示这可能会改变AI竞赛的格局。 一些分析认为,DeepSeek的成功并非偶然。其拥有超过一万块甚至可能高达五万块的GPU,并且只从中国排名前三的大学招聘人才,展现出强大的资源实力和人才储备。此外,中国科技公司可能享有的补贴也降低了DeepSeek的研发成本。
3. 开源的力量与未来展望
DeepSeek R1的成功,也让业界重新审视开源AI模型的潜力。Hyperbolic的CTO Yuchen Jin指出,DeepSeek R1证明了开源AI与闭源AI的差距不到6个月,中国正在主导开源AI竞赛,强化学习正进入黄金时代,蒸馏模型也展现出强大的力量。 Meta首席人工智能科学家Yann LeCun则认为,DeepSeek的成功并非中国超越美国AI的证据,而是开源模型正在超越专有模型的体现。他强调了开放研究和开源社区的重要性,DeepSeek正是受益于Meta的PyTorch和Llama等开源项目。
4. 持续的竞争与未知的未来
DeepSeek的出现,引发了AI行业激烈的竞争。Meta正在加大投资建设数据中心,其他公司也在摩拳擦掌。 虽然目前DeepSeek主要是在对现有模型的快速跟进,但其迅速的研发进度和对人才的培养,使其具备了强大的竞争力。 未来谁将最终胜出仍是未知数,但DeepSeek的崛起无疑为AI领域注入了新的活力,也为全球AI格局带来了新的变数。 同时,人们对新技术的兴奋之余,也对未来发展抱有谨慎的思考。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台