OpenAI拒绝进一步置评
原标题:硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
文章来源:量子位
内容字数:6277字
OpenAI与Anthropic罕见联手围剿DeepSeek:模型蒸馏引发的争议
近日,OpenAI和Anthropic两家AI巨头罕见联手,对开源AI模型公司DeepSeek展开调查,引发行业热议。起因是OpenAI声称DeepSeek利用其模型进行训练,涉嫌知识产权,具体指控为“模型蒸馏”。
1. OpenAI的指控与行业反应
OpenAI指控DeepSeek通过模型蒸馏技术,利用OpenAI模型的输出提升自身模型性能,这违反了OpenAI的服务条款。此消息一出,引发业内人士广泛质疑,认为OpenAI此举具有讽刺意味,因为OpenAI自身在数据获取方面也存在合规性问题,曾被《纽约时报》以知识产权为由告上法庭。
2. Anthropic的回应与模型蒸馏技术
Anthropic创始人Dario Amodei则认为DeepSeek的威胁被夸大,其模型水平与Anthropic 7-10个月前的模型相当,只是成本更低。他更关注的是如何保持领先地位,暗示需要设置更多限制。 模型蒸馏本身是一种常见的模型压缩技术,通过将大型模型的知识“蒸馏”到小型模型,提高效率并降低成本。该技术在学术界和工业界广泛应用,许多开源模型的服务条款也允许蒸馏。
3. 微软的耐人寻味之举
微软在OpenAI指控DeepSeek后数小时,在其AI平台接入了DeepSeek模型,此举耐人寻味,被网友戏称为“否认是接受的第一步”。微软员工表示DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。
4. DeepSeek的回应与模型价值
DeepSeek首席科学家Mark Chen回应称,DeepSeek R1并非简单蒸馏,其发现了OpenAI在实现o1过程中的一些核心理念,并在成本控制方面取得了显著成果。OpenAI首席科学家也认可了DeepSeek在成本控制上的工作,并承认模型蒸馏技术的趋势。
5. DeepSeek R1的意义与行业趋势
分析师郭明錤认为DeepSeek R1加速了两个趋势:一是AI算力优化,在Scaling Law放缓的情况下,通过优化训练方式持续提升模型效益;二是API/Token价格下滑,加速AI应用多元化。DeepSeek R1的低成本策略将有助于增加AI算力需求,降低投资风险。
6. 总结
OpenAI对DeepSeek的指控引发了关于模型蒸馏技术、数据使用权和AI行业竞争的广泛讨论。尽管模型蒸馏技术本身被广泛接受,但其在特定服务条款下的应用仍存在争议。OpenAI自身在数据合规性方面的问题也使其指控的公信力受到质疑。DeepSeek R1的出现则凸显了AI领域在降低成本和提高效率方面的持续探索。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破