大模型集体失智!9.11和9.9哪个大,几乎全翻车了

AIGC动态5个月前发布 量子位
30 0 0

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

AIGC动态欢迎阅读

原标题:大模型集体失智!9.11和9.9哪个大,几乎全翻车了
关键字:报告,腾讯,模型,提示,问题
文章来源:量子位
内容字数:0字

内容摘要:


梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??
强如GPT-4o,都坚定地认为9.11更大。
谷歌Gemini Advanced付费版,同样的口径。
新王Claude 3.5 Sonnet,还一本正经的给出离谱的计算方法。
9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10
到这一步还是对的,但下一步突然就不讲道理了
如上所示,9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗?
这你还解释啥啊解释,简直要怀疑是全世界AI联合起来人类了。
艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示:
一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。
也有网友发现了华点,如果是说软件版本号,那么9.11版本确实比9.9版本更大(更新)。
而AI都是软件工程师开发的,所以……
那么,究竟是怎么回事?
先进大模型集体翻车‍‍‍‍‍‍‍一觉醒来,一众响当当的大模型开始认为“9.11>9.9”了?
发现这个问题的是Riley Goodside,有


原文链接:大模型集体失智!9.11和9.9哪个大,几乎全翻车了

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...