谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

AIGC动态1年前 (2025)发布量子位

2024年IMO第四题只用19秒

原标题：谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平
文章来源：量子位
内容字数：3559字

谷歌DeepMind数学AI AlphaGeometry2：攻克IMO几何难题

谷歌DeepMind最新研发的数学AI AlphaGeometry2在解决国际数学奥林匹克竞赛（IMO）几何问题上取得了突破性进展。该系统在2000-2024年IMO竞赛的50道几何题中成功解决了42道，准确率高达84%，相比前一代AlphaGeometry1提升了15道。这项成就甚至超越了纯语言模型OpenAI o1和Gemini Flash Thinking，达到了与顶级人类选手相当的金牌水平。Nature杂志也对此进行了报道，称DeepMind的AI粉碎了数学难题。

AlphaGeometry2的惊人速度和解题能力

AlphaGeometry2展现了令人惊叹的速度和解题能力。例如，它仅用19秒就解决了2024年IMO竞赛的第四题，该题要求证明两个角度之和等于180°。AlphaGeometry2通过巧妙地构造辅助线，并利用相似三角形的性质完成了证明。更令人印象深刻的是，它还解决了此前仅有数值解的IMO Shortlist 2009的一道难题，并给出了优雅的几何证明，所有辅助点的坐标都是神经网络预测的。

AlphaGeometry2的四大核心升级

AlphaGeometry2的显著进步源于四个方面的升级：

扩展版的领域专用语言： AlphaGeometry1的领域专用语言仅包含9个谓词，AlphaGeometry2对其进行了扩展，覆盖率从66%提升到88%，能够处理线性方程、点/线/圆的移动以及角度计算等问题。
升级版的符号推理引擎DDAR2： DDAR2拥有更快的算法和更强大的功能，能够处理坐标相同的不同名称的点，时间复杂度从8次方降低到3次方，并通过C++实现代码，速度提升了300倍。
全新的搜索算法SKEST： SKEST通过多个搜索树并行运行和知识共享机制，更高效地寻找证明路径。
更强大的语言模型： AlphaGeometry2采用最新的Gemini架构，并通过三种训练方法进行训练，实验结果表明，代数推理是解决几何问题的核心，而视觉信息并非关键因素。

AlphaGeometry2的未来与AIMO竞赛

虽然AlphaGeometry2已经具备了获得AIMO竞赛金牌的能力，但目前并未开源。AIMO竞赛为AI设立，首个获得金牌的开源AI系统将获得500万美元的奖金，这为其他研究团队提供了机会。2025年IMO竞赛将于7月份在澳大利亚举行，AlphaGeometry2的未来表现值得期待。

联系作者

文章来源：量子位
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

阅读原文

# AIGC动态 # AI几何证明能力 # AI数学竞赛 # AI超越人类专家 # 人工智能解题能力突破 # 大型语言模型数学应用

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

2024年IMO第四题只用19秒

谷歌DeepMind数学AI AlphaGeometry2：攻克IMO几何难题

AlphaGeometry2的惊人速度和解题能力

AlphaGeometry2的四大核心升级

AlphaGeometry2的未来与AIMO竞赛

联系作者

DeepSeek下棋靠忽悠赢了ChatGPT，网友：孙子兵法都用上了

苹果把台灯做成机器人！能用动作表达情绪，重新定义机器人交互

相关文章

暂无评论