长远来看,算力才是真正的决胜因素。
原标题:DeepSeek是否利空算力?
文章来源:智猩猩GenAI
内容字数:3787字
DeepSeek V3与R1:开源浪潮下的算力博弈
本文总结了关于DeepSeek V3和R1模型训练成本及开源对算力市场影响的讨论要点,主要观点是:开源模型的崛起,特别是DeepSeek系列,正在重塑AI算力格局,并最终利好整个行业。
训练成本的:远超550万美元
网络广泛流传的DeepSeek V3 550万美元训练成本,仅为其正式训练成本的冰山一角,未包含前期研究、实验等费用。 幻方R1的训练成本更是远高于V3,这体现了前沿探索与后发追赶在算力需求上的巨大差异。
算力效率提升并非成本降低:而是更高效地攫取更大收益
算法进步、算力通缩、模型蒸馏等技术提升了训练效率,但并未降低整体训练成本。相反,这使得模型训练者能够利用更高的效率,榨取更多算力,以获得更大的收益。 这解释了为何即使在算力效率提升后,像幻方这样的机构仍在面临算力不足的问题。
开源的胜利:闭源模型的挑战
DeepSeek的开源,代表着开源模型对闭源模型的一次重大胜利。 这在国内已有所体现,一些未能赶上开源模型步伐的闭源公司面临倒闭或转型。 未来,如果闭源模型无法超越开源模型的性能,其API价值将大幅下降。 然而,这也将导致模型训练参与者的减少。
推理成本的降低:应用繁荣的引擎
DeepSeek V3在推理成本上的降低,比训练成本的降低更为显著。其兼容性强,支持多种类型的GPU,这将促进LLM应用的繁荣,并最终拉动更大的算力需求。 这与早期昂贵的推理成本形成鲜明对比。
北美算力投资的反思:从浪费到繁荣
北美大型云服务提供商过去两年投入巨资用于算力建设,但其中一部分可能因早期探索而浪费。 然而,开源模型的繁荣最终将利好这些云服务提供商,因为算力需求将转向推理,而非仅仅是训练。 这印证了“算力才是真正的决胜因素”的观点。
未来展望:算力与应用的双重增长
未来,算力需求将主要来自推理,而非训练。 开源模型的快速迭代和应用生态的繁荣,将持续推动算力需求的增长。 这将形成一个良性循环,驱动整个AI行业的进一步发展。
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:智猩猩旗下账号,专注于生成式人工智能,主要分享技术文章、论文成果与产品信息。