原标题:o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现
文章来源:新智元
内容字数:4287字
OpenAI o3模型:智商157,AGI曙光乍现?
近日,一张声称OpenAI模型o3智商高达157的图片在网络疯传,引发热议。该模型在编程竞赛Codeforces和数学基准FrontierMath中表现惊艳,甚至超越了部分人类专家的水平。这是否意味着通用人工智能(AGI)的到来?本文将对o3模型及其相关争议进行梳理。
o3模型的惊人表现
根据报道,o3模型在Codeforces中得分超过2700,达到国际大师水平;在FrontierMath中表现也令人瞩目。其智商被估算为157,远超99%的人类。从GPT-4o到o3,OpenAI模型的智商在一年内实现了显著提升,体现了“Scaling Law”的持续有效性。
o3模型的技术创新
o3的核心创新在于实现了token空间内自研语言程序搜索和执行,类似于AlphaZero的蒙特卡洛树搜索,是一种深度学习引导的程序搜索形式。这种技术使得o3能够在解决问题时搜索可能的解法空间,并选择最优方案。
ARC-AGI测试争议
o3在ARC-AGI基准测试中取得了优异成绩,在高计算模式下得分超过了人类平均水平。然而,这一结果引发了争议。部分人士质疑OpenAI是否对o3进行了针对性训练,因为o3在公共训练集75%的数据上进行训练,且未公开更多细节。OpenAI对此进行了反驳,但争议依然存在。
o3模型的应用前景
o3模型在编程、数学和科学领域展现出巨大的潜力,尤其对于解决复杂科学问题(如核聚变能源)的研究人员具有重要意义。但对于普通用户而言,o3可能略显“大材小用”。
AGI的未来展望
OpenAI的研究人员认为,o3并非AGI,距离AGI还有很长的路要走。然而,o3的快速发展以及其他科技巨头(如谷歌)在推理模型领域的积极投入,预示着AGI的到来可能比我们预期的更快。o4甚至更强大的模型或许即将出现,例如代号为Orion的模型,其性能可能更加令人期待。推理模型的高昂计算成本也值得关注,o3每个高计算任务的成本超过1000美元,这解释了OpenAI博士级AI助手的昂贵价格。
总而言之,OpenAI o3模型的出现标志着人工智能领域取得了显著进展,但同时也引发了关于AGI发展速度、测试方法以及伦理问题的讨论。未来,人工智能技术将持续发展,为人类社会带来更多机遇和挑战。
联系作者
文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。