《自然》发文：中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已

原标题：《自然》发文：中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
文章来源：人工智能学家
内容字数：16062字

本文报道了中国初创公司DeepSeek发布的大型语言模型DeepSeek-R1，其性能与OpenAI的o1相当，但价格却低廉许多，且对研究人员开放，引发了全球科学家的兴奋。

DeepSeek-R1在化学、数学和编码等任务上的表现与OpenAI的o1不相上下，甚至在某些方面超越了o1。然而，其使用成本却只有o1的三十分之一，这使得更多研究人员能够负担得起使用该模型进行研究。

与OpenAI的封闭模型不同，DeepSeek-R1以“开放权重”的方式发布，研究人员可以研究和改进其算法，这极大地促进了AI研究的开放性和合作性。虽然训练数据尚未公开，但MIT许可证下的重用也为研究提供了极大的便利。

DeepSeek-R1的成功，尤其是在美国出口管制限制下取得的成就，表明高效的资源利用比单纯的计算规模更重要。这挑战了美国在AI领域的领先地位，也暗示着全球AI竞争格局的转变。

DeepSeek-R1与o1一样，采用“思维链”方法，能够逐步生成响应，模拟人类推理过程，从而更好地解决复杂科学问题。DeepSeek通过强化学习对模型进行微调，进一步提升了其推理和解决问题的能力。

DeepSeek-R1在一些基准测试中取得了与o1相当甚至更好的成绩。更重要的是，其开放性使得研究人员可以访问其“思维链”，从而更好地理解模型的推理过程，提高了模型的可解释性。

DeepSeek-R1的出现标志着中国在大型语言模型领域取得了重大突破，其低廉的价格和开放性将极大地推动AI在科学研究和各个领域的应用普及，并有望改变全球AI竞争格局。

文章还提及DeepSeek公司此前发布的机器人V3也表现出色，以及DeepSeek在有限预算下取得的成就，进一步印证了其在AI领域的技术实力和创新能力。研究人员已经开始利用DeepSeek-R1进行各种科学研究，并取得了令人印象深刻的结果。

联系作者

文章来源：人工智能学家
作者微信：
作者简介：致力成为权威的人工智能科技媒体和前沿科技研究机构

文章版权归作者所有，未经允许请勿转载。

暂无评论...