LeCun也点评了
原标题:DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看
文章来源:量子位
内容字数:5956字
DeepSeek:来自东方的神秘力量席卷硅谷
文章报道了中国开源大模型DeepSeek-R1在全球大模型竞技榜上取得的亮眼成绩,并分析了其成功背后的原因以及硅谷对它的关注。
DeepSeek的崛起:开源、低成本、高性能
DeepSeek-R1以其开源、成本仅为ChatGPT-4o的1/20的优势,跻身大模型竞技榜前三,并在复杂提示词/风格控制榜单上排名第一。其在编程能力方面也表现出色,仅次于闭源模型Claude 3.5 Sonnet。这一成绩引发了硅谷的广泛关注,特别是对于DeepSeek的盈利模式和成功秘诀产生了强烈的好奇。
硅谷关注的焦点:盈利模式和成功秘诀
硅谷最关心的问题是DeepSeek如何盈利。出乎意料的是,DeepSeek似乎并未将盈利放在首位,它是由幻方量化——一家拥有强大算力资源和顶级科学家的量化投资公司——作为“副产物”开发的。 硅谷还对DeepSeek的成功原因进行了深入分析,主要关注以下五个方面:
创新第一性原则:DeepSeek专注于基础AGI研究,而非单纯追求商业化,这与其他中国AI公司形成了鲜明对比。
性架构:DeepSeek独创的MLA架构大幅降低了显存占用和推理成本,使其在成本方面具有显著优势。
独特的公司文化和人才战略:DeepSeek采用自下而上的组织结构,重视创造热情而非证书,并主要依靠本土年轻人才。
致力于开源:DeepSeek坚持开源,认为这对于构建强大的技术生态系统至关重要。
底层计算挑战:尽管拥有强大的资源,DeepSeek仍然面临高端算力获取的挑战。
DeepSeek的成功之路:从量化交易到AGI
DeepSeek的创始人梁文锋最初从事量化交易,通过多年的积累和发展,幻方量化拥有了强大的资金和算力基础。2023年,幻方量化成立DeepSeek,专注于AGI研究,最终取得了令人瞩目的成就。其成功并非偶然,而是基于多年技术积累和独特的公司文化。
结语:坚持理想与商业化的平衡
DeepSeek的成功故事激发了全球AI领域的热情,但也引发了对其商业化路径的讨论。虽然在商业化方面略显“天真”,但其坚持理想、专注技术、并取得突破性进展的事实,为其他AI公司树立了榜样。DeepSeek的出现,标志着开源模型正在超越专有模型,并对全球AI格局产生了深远的影响。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破