为什么中国只有一个 DeepSeek?

投机者能抓住短期机会,但实力者才能抓住长期机会。

为什么中国只有一个 DeepSeek?

原标题:为什么中国只有一个 DeepSeek?
文章来源:AI科技评论
内容字数:12978字

中国大模型创业:冰火两重天与DeepSeek现象

本文探讨了中国大模型创业圈在DeepSeek崛起后呈现的“冰火两重天”局面,分析了造成这种局面的原因,并展望了中国AGI发展的未来。

1. 系统性错位:资本与技术的脱节

1. 2023年前,中国大模型创业公司屈指可数,主要来自清华大学。2023年后,Llama开源降低了技术门槛,大量公司涌入,但市场对技术创新的敬畏之心减弱。

2. 资本追逐快速商业化,投资转向拥有成功创业经验的团队,忽视了技术实力,导致资金和人才资源错配。技术领先的企业如面壁智能因其“高效训练”的理念在早期融资中受阻,而缺乏技术积累的企业却获得了大量融资。

3. 这种系统性错位导致有技术实力的团队资源匮乏,而缺乏技术能力的团队占据了大量资源,阻碍了中国大模型技术的长期发展。

2. AGI军团可遇不可求:短视的商业化策略

1. 市场对技术的短视导致许多公司将目标转向短期商业化和产品打磨,而非长期的AGI研究。 VC的投资周期缩短,进一步加剧了这种趋势。

2. DeepSeek专注AGI研究,凭借自身资金支持,不受市场短期压力影响,得以专注技术突破。其他公司则难以复制DeepSeek的模式,因为他们需要平衡商业化和技术研发。

3. 人才流向大厂,也加剧了创业团队的困境。DeepSeek在人才招募方面也面临挑战,高门槛和对AGI的纯粹追求使得人才争夺激烈。

3. 创新的品味:理想主义与长远眼光

1. DeepSeek的成功并非偶然,其团队拥有强大的技术实力、理想主义精神和独特的组织文化。团队成员多来自幻方量化,拥有顶尖的技术能力和对技术的敬畏之心。

2. DeepSeek创始人梁文锋的个人风格和公司扁平化的管理模式,使其能快速响应技术挑战,高效地协调资源。

3. 文章指出,国内也存在其他坚持创新的团队,例如马毅教授团队致力于可解释AI,智谱团队探索多模态大模型,面壁团队关注大模型架构的改进。这些团队的努力对推动中国AGI发展至关重要。

4. 文章强调,在AGI发展中,创新比模仿更重要,长期的资源应该流向那些具有强大技术实力和远见卓识的团队。DeepSeek的成功只是一个开始,希望未来中国能涌现出更多这样的AGI创新者。


联系作者

文章来源:AI科技评论
作者微信:
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...