o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义

AIGC动态2年前 (2024)发布机器之心

至于可靠性，有待后续验证。

原标题：o3智商高达157？每13333人中才有一个这么高，网友：编码分数无意义
文章来源：机器之心
内容字数：2387字

OpenAI o3智商引发热议：157的IQ真实性存疑

近日，Reddit上一则热帖宣称OpenAI的o3模型智商高达157，引发广泛关注。该帖声称，根据Codeforces编码评级粗略估计，o3的智商在人类中仅有0.0075%能够达到，远超GPT-4o(115)、o1 preview(123)、o1(135)、o1 pro(139)和o3 mini(141)。

o3智商评估方法的争议
该智商评估方法基于Codeforces编码评级，假设参与者为前15%的竞争程序员。然而，这一方法受到了广泛质疑。许多网友指出，编码能力并不能完全代表智商，尤其对于LLM而言，它们对互联网上公开的代码具有完美的记忆能力，这使得基于编码能力的智商评估缺乏说服力。此外，智商测试本身就是为评估人类智力而设计的，直接套用在AI模型上并不合适。
AI模型能力进步显著
尽管o3的智商评估存在争议，但文章也提到AI大模型能力的显著进步。例如，GPT-4o在AIME数学竞赛中的成绩在七个月内从13.4分跃升至96.7分，展现了AI模型学习能力的飞速提升。o1在挪威门萨智商测试中取得了133分的成绩，与Reddit帖子中估计的135分较为接近，一定程度上增加了对o3智商评估可靠性的怀疑。
网友评论及观点
网友对o3智商高达157的结论褒贬不一。一些网友认为该数据荒谬，编码能力不能等同于智商；另一些网友则认为这是一种基于相关性的转换，但相关性较弱，且转换结果在机器智能上的效果不明确。普遍观点认为，将单一指标（编码能力）推断为广义智能是不合理的，并且该评估方法并未真正使用智商测试。
结论：炒作嫌疑
总而言之，目前关于OpenAI o3智商高达157的说法缺乏足够的证据支持，其评估方法存在严重缺陷。虽然AI大模型的能力确实在快速进步，但将o3的智商夸大至如此程度，很可能只是一场炒作。 o3正式发布后的实际测试结果将是检验其真实能力的关键。