DeepSeek发现o1核心思路，OpenAI首席研究官亲自证实！奥特曼被迫发声

AIGC动态12个月前发布新智元

361 0 0

DeepSeek独立发现o1核心思路，OpenAI首席研究官亲自证实！奥特曼被迫发声

原标题：DeepSeek发现o1核心思路，OpenAI首席研究官亲自证实！奥特曼被迫发声
文章来源：新智元
内容字数：9305字

DeepSeek R1：撼动硅谷的东方神秘力量

近日，DeepSeek R1的横空出世在全球科技界引发巨大震动，其低成本、高性能的特性撼动了硅谷的AI格局，引发了AI领域的“恐惧”蔓延。本文将对DeepSeek R1及其影响进行简要概述。

DeepSeek R1的突破
DeepSeek R1以远低于科技巨头成本实现了与顶级AI模型相当的性能。这一突破并非依赖巨额算力投入，而是通过精妙的工程设计，特别是模型蒸馏和强化学习等技术实现的。其在Hugging Face上的点赞数也直线上升，印证了其影响力。
硅谷巨头的反应
OpenAI的CEO奥特曼和首席研究官Mark Chen都公开承认了DeepSeek R1的技术突破，并表示将加快新模型的发布。他们认为DeepSeek发现了o1模型的核心思想，但同时强调OpenAI在“预训练”和“推理”两大范式上的持续发力，以及蒸馏技术带来的成本控制和性能提升的解耦。
DeepSeek R1颠覆的三个假设
纽约时报作者Kevin Roose指出，DeepSeek R1动摇了美国科技产业的三个主要假设：1. 构建顶尖AI模型需要巨额资金投入；2. 模型越大越好；3. 美国在AI竞赛中领先优势显著。DeepSeek R1的出现证明了平民算力也能颠覆游戏规则，相对较小的模型也能达到甚至超越大型模型的性能，并挑战了美国在AI领域的绝对领先地位。
DeepSeek R1的技术细节
DeepSeek R1的训练过程包含三个关键步骤：1. 使用一个临时的高质量推理大语言模型生成监督微调数据；2. 利用大规模强化学习创建推理模型（R1-Zero）；3. 通过通用RL训练阶段提升模型在推理和非推理任务上的表现。其核心在于通过自动化方式验证和标注推理问题，从而减少对人工标注数据的依赖。
市场反应与未来展望
DeepSeek R1的出现引发了科技股的集体重挫，但一些业内人士认为市场反应过度。他们认为DeepSeek降低了AI成本，将推动AI的更广泛应用，并持续维持市场对英伟达芯片的需求。英特尔前CEO Pat Gelsinger也表达了类似观点，并买入了英伟达股票。

总而言之，DeepSeek R1的成功代表着中国AI技术实力的显著提升，也对全球AI格局造成了深远影响。其低成本、高性能的特性，将推动AI技术的普及和应用，并引发AI领域新的竞争和发展。