神秘大模型一夜刷屏，能力太强被疑GPT-4.5，奥特曼避而不答打哑谜

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：神秘大模型一夜刷屏，能力太强被疑GPT-4.5，奥特曼避而不答打哑谜
关键字：模型,问题,中文,提示,能力
文章来源：量子位
内容字数：4714字

内容摘要：

梦晨明敏发自凹非寺量子位 | 公众号 QbitAI一夜之间，大模型话题王，再次易主。
一个神秘模型突然杀入众人视野，能力超越一众开源模型，甚至包括GPT-4。几乎所有人都在谈论它，服务器都被挤爆了。
它就是“gpt2-chatbot”。
（注意啊，是gpt2不是GPT-2）
它有多强？
IMO国际数学奥林匹克竞赛的题目，一次答对。一次在PyOpenGL中生成旋转3D立方体。
直接输出如下结果：
在GPT-4标志性能力“画独角兽”上，还能轻松秒杀LLaMA-3-70B（左）。
推理方面更是表现出了惊艳效果，常见逻辑陷阱可以轻松绕过，而且回答时还带有合适的语气。
提问：1公斤羽毛和1公斤铅块，哪个更重？
回答：一公斤羽毛和一公斤铅的重量是一样的——它们都是一公斤。两者之间的关键区别在于它们的体积和密度:一公斤的羽毛会占据更多的空间，看起来更大，而一公斤的铅会紧凑而小。这通常会导致一个经典的问题，但就重量而言，一公斤就是一公斤!
如此好的表现，但是又没明说身份……
这不是更让大伙兴奋了！
难道是传说中的GPT-4.5？
要知道，名震江湖的AlphaGo就曾使用“Master”化名在网上

原文链接：神秘大模型一夜刷屏，能力太强被疑GPT-4.5，奥特曼避而不答打哑谜