原标题:DeepSeek测算:算力、性能、成本等
文章来源:人工智能学家
内容字数:25808字
DeepSeek:中国AI实验室的崛起与全球影响
本文分析了SemiAnalysis报告中关于中国AI实验室DeepSeek的深度解读,涵盖其成本、性能、人才策略以及对全球AI行业的影响。DeepSeek的迅速崛起,引发了全球范围内的热议,其日流量已超越众多国际知名AI模型。
1. DeepSeek的背景与资源
DeepSeek由中国量化对冲基金幻方量化于2023年5月成立,初期融资完全由幻方提供。 报告估计,DeepSeek在GPU方面的投资已超过5亿美元,拥有约50,000张英伟达Hopper架构GPU,其中包括约10,000张H800、10,000张H100以及大量H20 GPU。其总服务器资本支出约为13亿美元,集群运营成本高达7.15亿美元。
2. DeepSeek的人才战略
DeepSeek注重实际能力,而非学历背景,为顶尖研究人员提供超过130万美元的年薪,吸引了大量中国本土人才。其灵活的组织架构和“随意使用数万张GPU”的招聘策略,极具吸引力。
3. DeepSeek的模型性能与成本
DeepSeek V3和R1模型的性能引发热议。虽然DeepSeek V3的训练成本被报道为约600万美元,但报告指出这仅是预训练成本,实际成本远高于此,包括研发、数据处理、人才成本和硬件TCO等。DeepSeek R1的性能与OpenAI的o1相当,但报告强调,R1的论文并未公布所有基准测试结果,且Google的Gemini Flash 2.0 Thinking在某些方面表现更优,成本也更低。
4. DeepSeek的技术突破
DeepSeek在多项技术上取得突破,包括:
- 多Token预测(MTP):提升训练效率。
- FP8训练:提升计算资源利用率。
- 混合专家模型(MoE):提高训练效率和降低推理成本。
- 强化学习(RL):提升R1的推理能力。
- 多头潜在注意力(MLA):大幅降低推理成本。
5. DeepSeek的商业模式与市场影响
DeepSeek可能目前正在补贴推理价格以抢占市场份额,其低成本策略可能会影响整个AI行业的商业模式。 报告认为,DeepSeek的崛起并非完全颠覆OpenAI,而是以更低的价格实现了相当的能力,这类似于半导体行业中新技术节点的竞争格局。
6. 出口管制与DeepSeek的未来
美国的出口管制对DeepSeek的GPU获取造成一定限制,但并未完全阻止其发展。 报告预测,未来出口管制可能会进一步收紧,DeepSeek的扩张能力将面临挑战。 中国对AI产业的大力扶持,将有助于DeepSeek未来的发展,但也可能导致其不再开源模型。
7. 总结
DeepSeek的崛起展现了中国AI领域的快速发展和巨大潜力。其低成本高性能的模型以及灵活的人才策略,对全球AI行业产生了重大影响。 然而,DeepSeek也面临着来自出口管制和市场竞争的挑战。未来的发展,仍充满不确定性。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构