LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」
关键字：模型,人类,问题,任务,论文
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：乔杨
【新智元导读】前段时间冲上热搜的问题「9.11比9.9大吗？」，让几乎所有LLM集体翻车。看似热度已过，但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷，以及未来的潜在改进方向。一边是OpenAI、Meta、Mistral、DeepMind等巨头们争先恐后地发模型，几乎每天都能听到重磅消息，给人一种「技术进步日新月异，AGI仅在眼前」的错觉。
另一边又是「9.9<9.11」难题继续发挥余热，从到微博，引发了全球网友的关注。
虽然LLM失智也不是第一天了，但几乎全部大模型都在如此简单的问题上翻车，的确罕见。
这种量级的讨论热度，也自然引来了大佬Karpathy的围观。他甚至表示，这已经成为自己最喜欢的LLM测试了。
GPT-4o的失手概率是1/3，但Claude几乎3/3全败
下面是Karpathy本人的实测结果。即使提示了Claude「按实数算，别按版本号算」，也根本不起作用。
突然和辅导孩子写作业的家长狠狠共情了
但是Karpathy这种级别的大佬，怎么会满足于找乐子？
作为AI技术界KOL，他今天发了一篇长推，把近半年来出现

原文链接：LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」