DeepSeek才是“真正的OpenAI”？｜甲子光年

AIGC动态2年前 (2025)发布甲子光年

虚假的OpenAI在被打假，真正的“OpenAI”在开源。

原标题：DeepSeek才是“真正的OpenAI”？｜甲子光年
文章来源：甲子光年
内容字数：9099字

DeepSeek R1：开源的推理模型挑战闭源OpenAI

本文报道了DeepSeek发布的开源推理模型DeepSeek R1，以及其与闭源OpenAI模型在性能和策略上的对比。DeepSeek R1凭借其开源、低价和强大的性能，引发了业界广泛关注，被誉为“真正的OpenAI”。

1. DeepSeek R1：基于强化学习的突破

DeepSeek R1的核心亮点在于其“没有监督微调下的直接强化学习”。团队首先尝试了DeepSeek-R1-Zero，直接用强化学习(RL)训练基础模型，无需监督微调数据。通过基于规则的奖励系统，模型在推理能力上取得了显著提升，甚至出现了“顿悟时刻”，展现了RL的强大潜力。然而，DeepSeek-R1-Zero也存在一些问题，如可读性差。为此，DeepSeek团队设计了一个四阶段流程，最终打造出DeepSeek R1，在多个基准测试中达到甚至超过了OpenAI o1的性能。

2. 简洁高效的训练策略

DeepSeek R1的成功，也证明了“基于强大的模型，使用简单的基于规则的奖励进行强化学习，经过大量训练，也能达到最强推理模型的效果”。团队摒弃了复杂的过程奖励模型，采用基于规则的奖励系统，降低了训练难度，并通过“数据即模型”的思路，利用DeepSeek-R1-Zero生成数据，优化DeepSeek R1的性能。这种简洁高效的训练方法，为其他研究者提供了新的思路。

3. 开源与低价：构建开放的AI生态

与OpenAI的闭源策略形成鲜明对比，DeepSeek R1及其相关模型均为开源，并采用了极具竞争力的低价策略，将每百万token的成本降低了约95%。这不仅降低了AI应用的门槛，也为中小企业和个人开发者提供了更多机会，推动了AI技术的普及和发展。DeepSeek的开源策略体现了“美美与共”的精神，构建了一个更加开放和包容的AI生态。