至于可靠性,有待后续验证。
原标题:o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义
文章来源:机器之心
内容字数:2387字
OpenAI o3智商引发热议:157的IQ真实性存疑
近日,Reddit上一则热帖宣称OpenAI的o3模型智商高达157,引发广泛关注。该帖声称,根据Codeforces编码评级粗略估计,o3的智商在人类中仅有0.0075%能够达到,远超GPT-4o(115)、o1 preview(123)、o1(135)、o1 pro(139)和o3 mini(141)。
o3智商评估方法的争议
该智商评估方法基于Codeforces编码评级,假设参与者为前15%的竞争程序员。然而,这一方法受到了广泛质疑。许多网友指出,编码能力并不能完全代表智商,尤其对于LLM而言,它们对互联网上公开的代码具有完美的记忆能力,这使得基于编码能力的智商评估缺乏说服力。 此外,智商测试本身就是为评估人类智力而设计的,直接套用在AI模型上并不合适。
AI模型能力进步显著
尽管o3的智商评估存在争议,但文章也提到AI大模型能力的显著进步。例如,GPT-4o在AIME数学竞赛中的成绩在七个月内从13.4分跃升至96.7分,展现了AI模型学习能力的飞速提升。o1在挪威门萨智商测试中取得了133分的成绩,与Reddit帖子中估计的135分较为接近,一定程度上增加了对o3智商评估可靠性的怀疑。
网友评论及观点
网友对o3智商高达157的结论褒贬不一。一些网友认为该数据荒谬,编码能力不能等同于智商;另一些网友则认为这是一种基于相关性的转换,但相关性较弱,且转换结果在机器智能上的效果不明确。 普遍观点认为,将单一指标(编码能力)推断为广义智能是不合理的,并且该评估方法并未真正使用智商测试。
结论:炒作嫌疑
总而言之,目前关于OpenAI o3智商高达157的说法缺乏足够的证据支持,其评估方法存在严重缺陷。 虽然AI大模型的能力确实在快速进步,但将o3的智商夸大至如此程度,很可能只是一场炒作。 o3正式发布后的实际测试结果将是检验其真实能力的关键。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台