谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

2024年IMO第四题只用19秒

谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平

原标题:谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
文章来源:量子位
内容字数:3559字

谷歌DeepMind数学AI AlphaGeometry2:攻克IMO几何难题

谷歌DeepMind最新研发的数学AI AlphaGeometry2在解决国际数学奥林匹克竞赛(IMO)几何问题上取得了突破性进展。该系统在2000-2024年IMO竞赛的50道几何题中成功解决了42道,准确率高达84%,相比前一代AlphaGeometry1提升了15道。这项成就甚至超越了纯语言模型OpenAI o1和Gemini Flash Thinking,达到了与顶级人类选手相当的金牌水平。Nature杂志也对此进行了报道,称DeepMind的AI粉碎了数学难题。

AlphaGeometry2的惊人速度和解题能力

AlphaGeometry2展现了令人惊叹的速度和解题能力。例如,它仅用19秒就解决了2024年IMO竞赛的第四题,该题要求证明两个角度之和等于180°。AlphaGeometry2通过巧妙地构造辅助线,并利用相似三角形的性质完成了证明。更令人印象深刻的是,它还解决了此前仅有数值解的IMO Shortlist 2009的一道难题,并给出了优雅的几何证明,所有辅助点的坐标都是神经网络预测的。

AlphaGeometry2的四大核心升级

AlphaGeometry2的显著进步源于四个方面的升级:

  1. 扩展版的领域专用语言: AlphaGeometry1的领域专用语言仅包含9个谓词,AlphaGeometry2对其进行了扩展,覆盖率从66%提升到88%,能够处理线性方程、点/线/圆的移动以及角度计算等问题。
  2. 升级版的符号推理引擎DDAR2: DDAR2拥有更快的算法和更强大的功能,能够处理坐标相同的不同名称的点,时间复杂度从8次方降低到3次方,并通过C++实现代码,速度提升了300倍。
  3. 全新的搜索算法SKEST: SKEST通过多个搜索树并行运行和知识共享机制,更高效地寻找证明路径。
  4. 更强大的语言模型: AlphaGeometry2采用最新的Gemini架构,并通过三种训练方法进行训练,实验结果表明,代数推理是解决几何问题的核心,而视觉信息并非关键因素。

AlphaGeometry2的未来与AIMO竞赛

虽然AlphaGeometry2已经具备了获得AIMO竞赛金牌的能力,但目前并未开源。AIMO竞赛为AI设立,首个获得金牌的开源AI系统将获得500万美元的奖金,这为其他研究团队提供了机会。2025年IMO竞赛将于7月份在澳大利亚举行,AlphaGeometry2的未来表现值得期待。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明
问小白满血版DeepSeek免费不限次数使用

相关文章

问小白满血版DeepSeek免费不限次数使用

暂无评论

暂无评论...