拾象科技李广密:对 DeepSeek 和智能下半场的几条判断
DeepSeek 虽然没有发明新范式,但推进整个行业进入了新范式。
原标题:拾象科技李广密:对 DeepSeek 和智能下半场的几条判断
文章来源:Founder Park
内容字数:9274字
DeepSeek:AI下半场的开端与未来展望
本文总结了近期关于DeepSeek的讨论,并展望AI领域未来的发展方向。DeepSeek的出现,被认为是AI发展进入“下半场”的重要标志,引发了业界广泛关注和热议。文章从多个角度分析了DeepSeek的影响,并提出了对未来AI突破方向的思考。
1. DeepSeek与行业巨头:DeepSeek在技术能力上已超越Meta Llama,但与OpenAI、Anthropic和Google等第一梯队相比仍有差距。DeepSeek的成功并非范式级创新,而是将OpenAI o1的RL范式开源,极大提升了该范式的普及率。在Transformer架构下超越第一梯队存在难度,未来突破有赖于下一代智能架构的出现。
2. DeepSeek开启新范式:虽然DeepSeek并非发明新范式,但它成功地将RL和test time compute范式推向大众,促进了更多AI研究人员转向该方向,加速了行业发展。OpenAI、Anthropic和Google等公司也因此加快了对RL的研究。
3. DeepSeek与Anthropic技术路线差异:Anthropic认为基础模型和推理模型应处于连续光谱,而非OpenAI的模型系列。Anthropic在预训练阶段就大量使用RL,提升基础模型能力,而非单纯依赖RL提升推理模型。
4. DeepSeek成功的因素:DeepSeek的成功既有必然性,也有偶然性。开源、低成本、联网+公开CoT以及RL泛化等技术亮点,加上恰当的发布时间和舆论环境,共同造就了DeepSeek的轰动效应。
5. DeepSeek的影响:ToC领域的Chatbot受冲击最大;To Developer领域影响有限;To Enterprise和To Government领域受影响较小,大型组织的决策更复杂。短期来看,闭源公司受冲击较大,但长期来看,拥有充裕算力资源的公司将受益。
6. 蒸馏技术:DeepSeek是否在预训练阶段大量使用蒸馏数据,将影响其技术突破的评价。蒸馏技术不太可能在基础模型层面超越SOTA,但DeepSeek R-1的成功可能与其优秀的Reward model有关。
7. AI领域的护城河:DeepSeek证明了智能技术进步的陡峭性,阶段性产品难以形成绝对壁垒。在AI时代,智能创新可能比其他任何形式的创新都更重要。
8. DeepSeek的商业化:DeepSeek尚未决定如何利用当前的流量。这凸显了将伟大的研究实验室和伟大的商业公司整合在一起的挑战。DeepSeek需要权衡短期流量和长期战略目标。
9. 未来的智能突破:未来的突破可能来自第一梯队的下一代模型或Agent的落地。拥有优秀人才和充裕资源的组织,更有可能在下一代范式中取得突破。
10. 结语:DeepSeek的出现增强了人们对中国AI人才的信心。未来AI发展需要全球合作,技术无国界。
联系作者
文章来源:Founder Park
作者微信:
作者简介:来自极客公园,专注与科技创业者聊「真问题」。