大模型同行焦虑、云厂「抢食」、芯片厂拼命,DeepSeek 效应仍在持续。
原标题:「鲶鱼」DeepSeek 正在搅动上下游
文章来源:AI科技评论
内容字数:8690字
DeepSeek 效应:席卷全球的AI新范式
春节后的科技圈依旧被DeepSeek效应所主导。这款开源模型以其低成本、高性能的特点,引发了全球范围内的震荡,其影响波及开源社区、芯片巨头、云服务厂商以及AI创业公司。
1. DeepSeek的成功与影响
DeepSeek R1模型及其应用APP上线后迅速爆火,日活用户达到2215万,超过ChatGPT的41.6%,成为全球增速最快的应用。其成功并非依赖单一技术,而是多项技术的完美结合,包括MoE架构、MLA技术以及强大的工程能力。DeepSeek开源的策略也为整个大模型发展注入了新的活力,并有望在图像、视频等领域进一步扩展。
DeepSeek的低成本特性,直接冲击了OpenAI的商业模式,后者被迫向免费用户提供o3-mini模型及推理思维链以应对竞争。 DeepSeek也推动了国内AI产业的团结,上游芯片厂商、中间层云厂和下游创业公司都积极参与到其生态建设中。
2. 第三方推理服务的机遇
DeepSeek APP服务器的繁忙,也间接催生了第三方推理服务的兴起。国内外云巨头纷纷上线DeepSeek模型API,掀起新一轮价格战。这与当年微软云绑定OpenAI的策略类似,但DeepSeek的开源性使其生态更为开放,更多厂商能够参与其中。
国内外众多AI基础设施厂商,例如硅基流动、潞晨科技、趋境科技等,也纷纷推出DeepSeek模型的本地化部署优化方案,以满足不同用户的需求。这些厂商在提供DeepSeek API服务后,都获得了显著的客户增长。
3. “颠覆英伟达”的冷思考
DeepSeek的出现,也对英伟达的市场地位造成冲击,使其股价大幅下跌。然而,这种冲击主要体现在高端算力领域,尤其是在推理侧。DeepSeek对CUDA的依赖,以及国产芯片在训练方面的不足,使得英伟达在训练环节的霸主地位短期内难以撼动。
国产芯片厂商纷纷适配DeepSeek模型,主要集中在推理应用方面,这为其提供了重要的发展机遇。虽然在适配过程中仍然存在一些工程难题,但国产芯片在推理侧的进步是显著的。DeepSeek的成功也推动了国产算力生态的建设,为和企业智能化发展提供了新的可能性。
4. 挑战与展望
DeepSeek的成功也带来了新的挑战,例如如何平衡大模型的使用效果和成本,以及如何满足用户对大模型能力的更高期待。 但总的来说,DeepSeek的出现,降低了大模型的训练、推理和应用成本,推动了整个AI产业的快速发展,并为国产AI产业带来了新的机遇和信心。
联系作者
文章来源:AI科技评论
作者微信:
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。