神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

AIGC动态8个月前发布 量子位
14 0 0

神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

AIGC动态欢迎阅读

原标题:神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜
关键字:模型,问题,中文,提示,能力
文章来源:量子位
内容字数:4714字

内容摘要:


梦晨 明敏 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,大模型话题王,再次易主。
一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。
它就是“gpt2-chatbot”。
(注意啊,是gpt2不是GPT-2)
它有多强?
IMO国际数学奥林匹克竞赛的题目,一次答对。一次在PyOpenGL中生成旋转3D立方体。
直接输出如下结果:
在GPT-4标志性能力“画独角兽”上,还能轻松秒杀LLaMA-3-70B(左)。
推理方面更是表现出了惊艳效果,常见逻辑陷阱可以轻松绕过,而且回答时还带有合适的语气。
提问:1公斤羽毛和1公斤铅块,哪个更重?
回答:一公斤羽毛和一公斤铅的重量是一样的——它们都是一公斤。两者之间的关键区别在于它们的体积和密度:一公斤的羽毛会占据更多的空间,看起来更大,而一公斤的铅会紧凑而小。这通常会导致一个经典的问题,但就重量而言,一公斤就是一公斤!
如此好的表现,但是又没明说身份……
这不是更让大伙兴奋了!
难道是传说中的GPT-4.5?
要知道,名震江湖的AlphaGo就曾使用“Master”化名在网上


原文链接:神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...