DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明

我们理论上可以赚更多钱,但我们没有。

DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明

原标题:DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
文章来源:机器之心
内容字数:5970字

DeepSeek开源周“One More Thing”:惊人的推理系统和盈利能力

DeepSeek在“开源周”的第五天结束后,出人意料地发布了第六天的内容,介绍了其DeepSeek-V3/R1推理系统的细节,并公布了令人震惊的性能数据和盈利潜力。

  1. 惊人的性能数据

    DeepSeek-V3/R1推理系统在H800 GPU上实现了极高的吞吐量:每个节点每秒可处理73.7k个输入token和14.8k个输出token。 该系统采用跨节点专家并行(EP)、计算-通信重叠和负载平衡等技术来优化吞吐量和延迟。如果所有token都按照DeepSeek-R1的最高价格计算,理论上每日收入可达562,027美元,成本利润率高达545%。然而,实际收入远低于此数字,因为V3定价更低,收费服务只占一部分,且夜间有折扣。

  2. 高效的系统设计

    为了实现高吞吐量和低延迟,DeepSeek-V3/R1采用了以下关键设计原则:

    • 跨节点专家并行(EP):通过将专家分布到多个GPU上,并利用预填充-解码分解架构,在不同阶段采用不同程度的并行性,显著扩展batch大小,提高GPU矩阵计算效率。
    • 计算-通信重叠:采用“dual-batch”策略和5阶段pipeline,隐藏通信延迟,提高吞吐量。
    • 负载平衡:针对预填充、解码和专家并行三个阶段分别设计负载平衡器,确保所有GPU的计算和通信负载均衡,避免性能瓶颈。
  3. 在线服务统计与盈利分析

    在过去24小时内,DeepSeek V3和R1推理服务的峰值节点占用达到278个,平均占用226.75个节点。每日总成本约为87,072美元。总输入token为608B,输出token为168B。平均输出速度为每秒20-22个token。 虽然理论上每日收入可观,但实际收入远低于此数字,主要原因是V3定价较低,部分服务免费,以及夜间折扣的应用。

  4. 开源周的持续和未来展望

    DeepSeek“开源周”意外延长至第六天,并公布了其推理系统的核心技术细节。社区对DeepSeek的持续开源举动以及其强大的推理系统表现出极大的兴趣,并期待开源周最后一天的“压轴”内容。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...