天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

o1惨败得0分!

天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

原标题:天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题
文章来源:新智元
内容字数:13926字

谷歌DeepMind AI攻克IMO几何难题,AlphaGeometry 2夺金

谷歌DeepMind的AI系统AlphaGeometry 2 (AG2) 在国际数学奥林匹克竞赛(IMO)几何题上取得突破性进展,解题率高达84%,超越了历年IMO金牌得主的平均水平,并成功了此前仅有计算性解法的2009年IMO最难几何题。

1. AlphaGeometry 2的重大升级

AG2相较于前代AG1,进行了多项关键升级:首先,它采用了基于Gemini的更强大语言模型,并在更大、更多样化的数据集上进行了训练,显著提升了理解和推理能力。其次,其符号引擎得到优化,速度提升了两个数量级,并增强了处理重合点和线性方程的能力。此外,AG2还扩展了领域特定语言(DSL),覆盖了88%的IMO几何题目,并创新性地引入了基于知识共享集成的搜索树(SKEST)算法,实现多个搜索树并行运行并相互帮助,极大提升了搜索效率。

2. SKEST算法和自动图形生成

SKEST算法是AG2的核心创新,它允许多个集束搜索并行运行并共享知识,显著加速了搜索过程。AG2还能自动理解自然语言形式的几何问题,并自动生成图形,即使对于非构造性问题,也能通过两阶段数值优化方法找到解决方案。

3. 更强大、更快的符号引擎DDAR

AG2的核心是改进后的符号引擎DDAR,它在处理重合点、算法速度和实现效率上都有显著提升。通过C++重新实现核心计算部分,速度比AG1快了300多倍。改进后的DDAR能更灵活地处理复杂几何图形,并以更接近人类思维的方式解决问题。

4. 更有效的合成训练数据

AG2使用了更大、更多样化、更复杂的合成训练数据,这些数据严格从随机图开始生成,避免了数据污染,并探索了可能超出人类已知定理分布的定理。这使得模型能够处理更复杂的问题,并具有更平衡的数据分布。

5. AlphaGeometry 2的创造性解法

AG2展现了超凡的创造力,它能够通过构建关键的辅助作图,仅依靠基本的角度关系推导和比例关系推导,解决此前只能用复杂计算方法才能解决的难题。这种解法甚至让谷歌研究员感到震惊,被认为是AI在几何证明领域的重大突破。

6. AlphaGeometry 2的局限性

尽管AG2取得了显著进展,但它仍然存在一些局限性。目前它无法解决涉及不等式、可变数量的点以及一些高级几何解法技巧(如反演、投影几何或根轴)的问题。

7. 结论

AlphaGeometry 2的成功标志着人工智能在数学领域取得了新的里程碑。它不仅展现了AI强大的解题能力,更重要的是,它展现了AI在创造性思维方面的潜力,为未来AI在科学研究和工程领域的应用提供了新的可能性。


联系作者

文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...