中美 AI 创业者的闭门讨论:DeepSeek-R1 之后,AI 创业的变化和新趋势
垂直领域的Agent能力会有大提升。
原标题:中美 AI 创业者的闭门讨论:DeepSeek-R1 之后,AI 创业的变化和新趋势
文章来源:Founder Park
内容字数:10936字
DeepSeek:2025年春节AI焦点与未来趋势
2025年春节期间,DeepSeek成为AI领域的焦点,其App登顶苹果商店免费榜,各大云厂商争相部署其R1模型。本文总结了极客公园组织的闭门讨论要点,探讨DeepSeek的创新、成本优势、应用前景及未来趋势。
DeepSeek的创新之处
DeepSeek V3基座模型参数规模达671B,是目前开源最强模型之一。其R1模型的核心创新在于“反思能力”,通过强化学习(RL)实现,推理能力与OpenAI o1相当,且代码能力与OpenAI o3 mini不相上下。DeepSeek成功关键在于高度集成化的工程方案,有效降低了成本。其方法虽并非全新,但激进地结合使用,并精巧地系统设计,实现了显著的性能优化。
DeepSeek低成本的秘诀
DeepSeek模型稀疏度极高,推理时仅激活37B参数,大幅降低资源消耗。其在软件架构上采用MoE架构,动态调整资源使用率,理论上可将成本压缩至原来的1/256。在训练阶段,DeepSeek摒弃了Tensor Parallelism,只使用Data Parallelism和Pipeline Parallelism,并进行精细的专家并行,从而绕过硬件限制,提高了训练效率,降低了成本。
Chatbot并非唯一AI入口
DeepSeek R1结合搜索功能,为用户提供全新的体验,这对于许多用户而言是他们第一次接触推理模型。未来,AI应用型公司的竞争壁垒在于产品体验,谁能提供更快速、更便捷、更舒适的功能,谁就能在市场中占据优势。
垂直场景AI落地加速
在垂直场景中,任务评估可通过规则系统完成,无需复杂的奖励模型,因此7B级别模型即可快速得到可用结果。DeepSeek蒸馏后的中小模型在垂直领域,尤其是有明确答案的任务(如数学计算)中表现出色且成本可控。然而,对于主观性较强的任务,仍需进一步探索更优的评估方法。
国产芯片助力推理算力
国产芯片在AI应用领域有望追赶英伟达,其瓶颈在于流片。DeepSeek与华为的合作,也体现了国产芯片在稳定供应方面的优势。专注于AI应用的国产芯片,有望在部分性能指标上追赶英伟达。
更强大的Agent与跨应用调用
未来,更强大的Agent将成为趋势,通过结合规则模型和基础模型迭代训练,并在特定领域实现超人类智能。跨应用调用能力也将成为热点,但需要解决不同操作系统下的权限管理问题。
总而言之,DeepSeek的出现标志着AI技术和应用的显著进步,其开源特性降低了AI应用的门槛,推动了垂直领域AI的快速落地。未来,更强大的Agent、跨应用调用能力以及更有效的训练方法将成为AI领域的研究热点。
联系作者
文章来源:Founder Park
作者微信:
作者简介:来自极客公园,专注与科技创业者聊「真问题」。