DeepSeek很强,但作业难抄。
原标题:月亏4亿 vs 毛利545%:MaaS商业模式的罗生门|甲子光年
文章来源:甲子光年
内容字数:14572字
DeepSeek引发的MaaS商业模式大讨论
本文探讨了围绕DeepSeek大模型引发的MaaS(模型即服务)商业模式的争议,并试图理清各方观点的合理性。
1. MaaS模式的本质与演变
MaaS是云计算产业链的新生态,分为两类:一类是像智谱、阿里云这样的大模型公司或云厂商,自研大模型并提供服务;另一类是像潞晨科技、硅基流动这样,提供第三方开源模型的MaaS服务,即“AI推理云服务”。开源模型的出现,降低了大模型服务的准入门槛,激发了AI推理云服务的兴起,也使得大模型token价格有下降空间。
2. DeepSeek:高性能与高门槛
DeepSeek大模型性能强劲,但其商业模式的盈利能力却引发争议。潞晨科技创始人尤洋认为,基于token计费的MaaS模式在现有算力成本下难以盈利,甚至可能月亏损4亿。硅基流动创始人袁进辉则反驳,认为尤洋的成本估算过于夸张,并指出DeepSeek官方公布的基于“MLA+DeepSeek MoE+专家并行”架构的部署策略,成本利润率高达545%。
争议的核心在于DeepSeek的推理效率。尤洋的计算基于较低的token生成速度,而DeepSeek官方及其他厂商的数据显示,通过优化,吞吐率可提升数倍甚至十倍以上,从而大幅降低成本,实现盈利。然而,DeepSeek的高效部署策略并非易于复制,其独特的架构和软硬件协同优化能力是关键。
3. DeepSeek MoE架构与技术挑战
DeepSeek采用MoE(混合专家)模型和专家并行策略,这与主流的Dense模型和张量并行策略不同。MoE模型通过激活特定专家来处理任务,提高效率,但需要复杂的部署和优化。DeepSeek的部署方案需要至少320张GPU卡,对资源和技术能力要求极高,这使得其他厂商难以复现其低成本高效率的模式。业内专家认为,DeepSeek的MoE架构更适合大厂或在C端有野心的公司。
4. 成本降低的两种途径:工程优化与架构创新
大模型成本降低主要依靠工程优化和架构创新。DeepSeek的“MLA+DeepSeek MoE+专家并行”架构是工程优化的典范,而其他公司如月之暗面也在工程优化方面取得了显著成果。与此同时,对注意力机制的改进,如DeepSeek的MLA和月之暗面的MoBA,以及硬件层面的创新,也推动了成本下降。
5. 结论:两种观点的融合
尤洋和袁进辉的观点并非完全对立。尤洋强调当前技术水平的限制,而袁进辉则着眼于未来的技术可能性。DeepSeek的成功表明,通过极致的工程优化和架构创新,MaaS模式是可行的,但对于大多数厂商而言,这仍然是一个高门槛的挑战。DeepSeek的成功,也为AI普惠时代开启了新的可能性。
联系作者
文章来源:甲子光年
作者微信:
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。