Yann LeCun:市场对于 DeepSeek 的成本反应并不合理。
原标题:OpenAI首席研究官:DeepSeek发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
文章来源:机器之心
内容字数:2926字
DeepSeek 引发的 AI 产业震荡:成本、算力与未来
近期,DeepSeek 发布的 DeepSeek-V3 和 DeepSeek-R1 模型以低成本实现了与 OpenAI 同类模型相当的性能,引发了 AI 行业的广泛关注,甚至导致英伟达股价大幅波动。这篇文章将对 DeepSeek 的影响以及业内人士的回应进行总结。
DeepSeek 的突破与市场担忧
DeepSeek 通过技术创新,降低了模型对算力的需求,在硬件受限的条件下取得了显著成果,获得了业内人士的认可。然而,这同时也引发了市场对 AI 硬件需求下降的担忧,尤其对英伟达高端芯片的需求可能减少。
OpenAI 的回应:算力投入的合理性
OpenAI 首席研究官 Mark Chen 对 DeepSeek 的成就表示祝贺,并承认 DeepSeek 发现了 OpenAI 在 o1 模型研发中的一些核心理念。但他认为市场反应过于夸大,特别是关于成本方面的说法。他强调 OpenAI 在预训练和推理两个维度上进行优化,并计划在两个维度上都积极投入算力。他还指出,降低成本和提升能力并非完全正相关,OpenAI 将继续提升模型服务能力,但会坚持既定的研究路线图。
成本争议:训练成本与推理成本的区分
关于 DeepSeek-V3 训练成本仅为 558 万美元的说法引发了争议。DeepSeek 的技术报告指出,该成本仅包含正式训练,不包括前期研究和实验成本。图灵奖得主 Yann LeCun 也认为市场反应并不合理,他指出巨额投资主要用于维护 AI 服务的稳定运行,而非仅仅用于模型训练,随着 AI 能力增强,维护成本也会更高。
推理成本的意义与未来展望
许多人认为,DeepSeek 在降低推理成本方面的努力比降低训练成本更值得关注,因为这将加速 AI 技术的普及,创造更大的市场。OpenAI 和 Meta 等公司也在积极准备应对可能到来的推理需求激增,例如 OpenAI 的“星际之门”项目和 Meta 的巨额 AI 投资。 DeepSeek 未来发展以及 AI 市场竞争依然激烈,值得持续关注。
总而言之,DeepSeek 的出现对 AI 行业产生了深远影响,引发了关于成本、算力投入以及 AI 技术发展方向的广泛讨论。未来,降低推理成本、提升模型服务能力将成为 AI 企业竞争的关键。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台