DeepSeek与OpenAI的巅峰对决：谁才是真正的技术巨头？

原标题：DeepSeek版o1与OpenAI的o1大PK，到底谁真的炸场了？
文章来源：夕小瑶科技说
内容字数：2850字

近日，DeepSeek推出了其新款类o1推理模型——DeepSeek R1-Lite，标志着国产大模型正式进入o1时代。根据官方介绍，R1-Lite的思维链长度可达数万字，采用强化学习技术，涵盖了大量的反思与验证环节。本文将对其性能进行分析，并与o1进行对比。

整体来看，DeepSeek R1-Lite在数学和编程方面的表现与o1-preview相当，甚至在某些榜单上超越了o1。例如，在美国数学竞赛（AMC）的最高难度级别AIME中，R1-Lite的得分大幅领先于o1。此外，R1-Lite的推理时间更长，性能也得到了显著提升。

DeepSeek团队强调，推理时间越长，模型性能越好。在对比R1-Lite和o1-preview时，随着思考时间的增加，R1-Lite在AIME上的得分稳步提高。目前，R1模型还在持续打磨中，未来将推出正式版和开放API。

在实际测试中，DeepSeek R1-Lite在处理“草莓”问题时表现不佳，反复怀疑自己的推理，最终得出错误结论。而在字母反转问题中，R1-Lite也未能正确反转字母，甚至引入了多余的字符。相比之下，o1在这些问题上虽然也出错，但错误较为简单。

在比较“9.9和9.11哪个大？”的问题时，R1-Lite最终得出正确答案，而o1则出错。对于经典的编程问题，R1-Lite经过长时间推理最终给出了错误答案，而o1则简洁地提供了正确答案。

在讨论大语言模型的未来时，R1-Lite提供了许多想法，但缺乏具体的可行方案，而o1则给出了更具实用性的建议。

总的来看，DeepSeek R1-Lite在开放性问题的思考上有较多的想法，但在准确性和实用性上仍有提升空间。尽管R1-Lite在某些领域表现出色，但o1在处理复杂问题时的表现依然值得关注。未来国产大模型的发展令人期待，DeepSeek的进步速度也让人刮目相看。

联系作者

文章来源：夕小瑶科技说
作者微信：
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

文章版权归作者所有，未经允许请勿转载。

暂无评论...