大模型集体失智！9.11和9.9哪个大，几乎全翻车了

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：大模型集体失智！9.11和9.9哪个大，几乎全翻车了
关键字：报告,腾讯,模型,提示,问题
文章来源：量子位
内容字数：0字

内容摘要：

梦晨一水发自凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？
强如GPT-4o，都坚定地认为9.11更大。
谷歌Gemini Advanced付费版，同样的口径。
新王Claude 3.5 Sonnet，还一本正经的给出离谱的计算方法。
9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10
到这一步还是对的，但下一步突然就不讲道理了
如上所示，9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗？
这你还解释啥啊解释，简直要怀疑是全世界AI联合起来人类了。
艾伦AI研究所成员林禹臣换了个数字测试，GPT-4o依旧翻车，他表示：
一方面AI越来越擅长做数学奥赛题，但另一方面常识依旧很难。
也有网友发现了华点，如果是说软件版本号，那么9.11版本确实比9.9版本更大（更新）。
而AI都是软件工程师开发的，所以……
那么，究竟是怎么回事？
先进大模型集体翻车‍‍‍‍‍‍‍一觉醒来，一众响当当的大模型开始认为“9.11>9.9”了？
发现这个问题的是Riley Goodside，有

原文链接：大模型集体失智！9.11和9.9哪个大，几乎全翻车了