LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

AIGC动态5个月前发布 新智元
3 0 0

LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

AIGC动态欢迎阅读

原标题:LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」
关键字:模型,人类,问题,任务,论文
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:乔杨
【新智元导读】前段时间冲上热搜的问题「9.11比9.9大吗?」,让几乎所有LLM集体翻车。看似热度已过,但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷,以及未来的潜在改进方向。一边是OpenAI、Meta、Mistral、DeepMind等巨头们争先恐后地发模型,几乎每天都能听到重磅消息,给人一种「技术进步日新月异,AGI仅在眼前」的错觉。
另一边又是「9.9<9.11」难题继续发挥余热,从到微博,引发了全球网友的关注。
虽然LLM失智也不是第一天了,但几乎全部大模型都在如此简单的问题上翻车,的确罕见。
这种量级的讨论热度,也自然引来了大佬Karpathy的围观。他甚至表示,这已经成为自己最喜欢的LLM测试了。
GPT-4o的失手概率是1/3,但Claude几乎3/3全败
下面是Karpathy本人的实测结果。即使提示了Claude「按实数算,别按版本号算」,也根本不起作用。
突然和辅导孩子写作业的家长狠狠共情了
但是Karpathy这种级别的大佬,怎么会满足于找乐子?
作为AI技术界KOL,他今天发了一篇长推,把近半年来出现


原文链接:LLM智能「参差不齐」!AI大牛Karpathy用表情包解释「9.9<9.11」

联系作者

文章来源:新智元
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...