天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

o1惨败得0分！

原标题：天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题
文章来源：新智元
内容字数：13926字

谷歌DeepMind AI攻克IMO几何难题，AlphaGeometry 2夺金

谷歌DeepMind的AI系统AlphaGeometry 2 (AG2) 在国际数学奥林匹克竞赛(IMO)几何题上取得突破性进展，解题率高达84%，超越了历年IMO金牌得主的平均水平，并成功了此前仅有计算性解法的2009年IMO最难几何题。

1. AlphaGeometry 2的重大升级

AG2相较于前代AG1，进行了多项关键升级：首先，它采用了基于Gemini的更强大语言模型，并在更大、更多样化的数据集上进行了训练，显著提升了理解和推理能力。其次，其符号引擎得到优化，速度提升了两个数量级，并增强了处理重合点和线性方程的能力。此外，AG2还扩展了领域特定语言(DSL)，覆盖了88%的IMO几何题目，并创新性地引入了基于知识共享集成的搜索树(SKEST)算法，实现多个搜索树并行运行并相互帮助，极大提升了搜索效率。

2. SKEST算法和自动图形生成

SKEST算法是AG2的核心创新，它允许多个集束搜索并行运行并共享知识，显著加速了搜索过程。AG2还能自动理解自然语言形式的几何问题，并自动生成图形，即使对于非构造性问题，也能通过两阶段数值优化方法找到解决方案。

3. 更强大、更快的符号引擎DDAR

AG2的核心是改进后的符号引擎DDAR，它在处理重合点、算法速度和实现效率上都有显著提升。通过C++重新实现核心计算部分，速度比AG1快了300多倍。改进后的DDAR能更灵活地处理复杂几何图形，并以更接近人类思维的方式解决问题。

4. 更有效的合成训练数据

AG2使用了更大、更多样化、更复杂的合成训练数据，这些数据严格从随机图开始生成，避免了数据污染，并探索了可能超出人类已知定理分布的定理。这使得模型能够处理更复杂的问题，并具有更平衡的数据分布。

5. AlphaGeometry 2的创造性解法

AG2展现了超凡的创造力，它能够通过构建关键的辅助作图，仅依靠基本的角度关系推导和比例关系推导，解决此前只能用复杂计算方法才能解决的难题。这种解法甚至让谷歌研究员感到震惊，被认为是AI在几何证明领域的重大突破。

6. AlphaGeometry 2的局限性

尽管AG2取得了显著进展，但它仍然存在一些局限性。目前它无法解决涉及不等式、可变数量的点以及一些高级几何解法技巧（如反演、投影几何或根轴）的问题。

7. 结论

AlphaGeometry 2的成功标志着人工智能在数学领域取得了新的里程碑。它不仅展现了AI强大的解题能力，更重要的是，它展现了AI在创造性思维方面的潜力，为未来AI在科学研究和工程领域的应用提供了新的可能性。

联系作者

文章来源：新智元
作者微信：
作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人对人类社会与文明进化的影响，领航中国新智能时代。

阅读原文

# AIGC动态 # AI几何题求解 # AI奥数竞赛 # IMO人工智能解题 # 人工智能数学突破 # 谷歌AI数学能力

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

o1惨败得0分！

谷歌DeepMind AI攻克IMO几何难题，AlphaGeometry 2夺金

1. AlphaGeometry 2的重大升级

2. SKEST算法和自动图形生成

3. 更强大、更快的符号引擎DDAR

4. 更有效的合成训练数据

5. AlphaGeometry 2的创造性解法

6. AlphaGeometry 2的局限性

7. 结论

联系作者

房价预测/矿藏勘探/自然灾害预测……AI助力地球科学革新，浙大/清华/Google Research等已发表重要成果

体验苹果新应用两天后，我开始期待微信「抄作业」

相关文章

暂无评论

ChatGPT

毕业论文生成器

AIGC热点