原标题:Anthropic创始人:DeepSeek只是以低成本生产出了美国7-10月前模型水平的产品,并不是独特突破!
文章来源:AI范儿
内容字数:13907字
DeepSeek深度解读:并非颠覆,而是AI发展进程中的一个节点
近日,中国AI初创公司DeepSeek发布的语言模型DeepSeek-R1引发轩然,其声称以远低于常规成本达到了美国顶级AI系统的性能水平。这一消息导致Nvidia市值大幅蒸发,并引发了关于AI未来发展的激烈讨论。然而,Anthropic联合创始人Dario Amodei对DeepSeek的成就进行了深入分析,其观点重塑了我们对DeepSeek公告的理解。
1. “600万美元模型”的误读
Amodei指出,“600万美元模型”的说法忽略了关键背景。他以Anthropic的Claude 3.5 Sonnet为例,指出其训练成本达数千万美元级别,且在许多任务上仍优于DeepSeek模型。DeepSeek的成本效率更像是AI开发成本自然演进的结果,而非性突破。DeepSeek以更低成本(但远非600万美元)实现了接近7-10个月前美国模型水平的产品,这符合AI开发成本每年约下降4倍的历史趋势。
2. DeepSeek-V3才是真正的技术突破
Amodei强调,市场关注的R1模型并非DeepSeek真正的技术突破,其更早发布的DeepSeek-V3才是关键。V3在某些重要任务上接近美国最先进模型的性能水平,同时大幅降低了训练成本,这主要归功于其在“Key-Value cache”管理和混合专家(MoE)方法方面的创新。
3. 企业总投资揭示真实图景
Amodei指出,DeepSeek据报道拥有约5万个Hopper一代芯片,这与主要美国AI公司的持有量差距并不大(约为2-3倍以内),成本约为10亿美元。这意味着DeepSeek在AI开发上的总体投入与美国同行相差无几,模型训练成本与企业总投资之间的区别突显了雄厚资源在AI开发中的持续重要性。
4. 当前“交叉点”的短暂性
Amodei认为,当前多家公司都能开发出优秀推理模型的情况,只是一种暂时现象,并非新的常态。随着各公司继续扩大模型规模,尤其是在资源密集的强化学习领域,行业可能会再次出现分化,资源投入将成为关键因素。DeepSeek的成就重要,但并未从根本上改变高级AI开发的长期经济规律。
总而言之,Amodei的分析表明,DeepSeek的成就并非彻底颠覆AI行业的性突破,而是AI发展进程中一个值得关注的节点。其成本效率的提升符合行业发展趋势,而其在整体资源投入方面与美国同行差距并不显著。当前多家公司在推理能力上达到类似水平的局面也只是暂时的,未来AI竞争仍将取决于资源投入和技术创新。
联系作者
文章来源:AI范儿
作者微信:
作者简介:专注于探索 AIGC,发掘人工智能的乐趣。