原标题:LeCun:Deepseek爆火不能说明中国AI强,只能说开源模型很强
文章来源:夕小瑶科技说
内容字数:4332字
DeepSeek横空出世,引发全球AI社区震动
近日,中国AI公司DeepSeek发布的V3和R1版本模型,在全球AI领域掀起轩然,引发了美国硅谷的焦虑和全球的“复现”浪潮。DeepSeek R1在AIME2024数学基准测试中表现出色,超越了OpenAI的o1,并在编码测试中展现出专家级水平。更令人瞩目的是,其成本仅为OpenAI的2%,且采用MIT许可证完全开源,这彻底打破了行业的游戏规则。
1. **DeepSeek的惊艳表现:** DeepSeek R1在多个基准测试中取得了令人难以置信的成绩,其性能远超预期,尤其是在成本方面具有绝对优势,每百万token的查询成本仅为0.14美元,远低于OpenAI的7.50美元。
2. **硅谷的焦虑与反思:** DeepSeek的成功让美国AI公司,特别是Meta,感到了巨大的压力。Meta员工在匿名社区Teamblind上表达了对DeepSeek V3低成本高性能的担忧,并指出DeepSeek V3的性能已经领先Llama 4。这种焦虑不仅源于技术上的落后,更涉及到自身商业模式和未来战略的重新审视。
3. **LeCun的解读:开源模式的胜利:** 面对美国对中国AI超越的担忧,Meta首席科学家Yann LeCun认为,关注的焦点应该放在开源模型对闭源模型的超越上。他指出DeepSeek的成功得益于开源研究和项目,并强调了开放研究和开源模式的巨大力量。
4. **扎克伯格的应对:** Meta CEO扎克伯格迅速回应,宣布加速Llama 4的研发,并计划巨资扩建数据中心和部署GPU,以确保Meta AI在2025年成为全球领先模型。
5. **DeepSeek CEO梁文锋的观点:打破偏见,中国AI的崛起:** DeepSeek CEO梁文锋驳斥了美国长期以来对中国科技创新能力的偏见,他认为DeepSeek的成功并非偶然,而是中国科技公司积极参与全球技术创新,并贡献自身力量的结果。他将DeepSeek比作一个厨师,利用开源资源和自身创新,做出美味的面包,并分享自己的菜谱。
6. **开源模式的深远意义:** DeepSeek的成功不仅仅是技术上的突破,更重要的是它展现了开源模式的巨大潜力。开放共享的模式促进了全球AI研究者的合作与进步,推动了AI技术朝着更健康、更普惠的方向发展。
7. **总结:** DeepSeek的横空出世,是AI领域一次具有里程碑意义的。它不仅挑战了现有AI巨头的霸主地位,更重要的是,它展示了开源模式的巨大力量,以及全球AI研究合作的重要性。这将深刻地影响未来的AI发展方向。
联系作者
文章来源:夕小瑶科技说
作者微信:
作者简介:低负担解码AI世界,硬核也可爱!聚集35万AI发烧友、开发者和从业者,广泛覆盖互联网大厂中高管、AI公司创始人和机构投资人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189