DeepMind祭出神经网络与符号AI融合新招。
原标题:再创历史!DeepMind AI超进化,能拿奥数金牌了
文章来源:智东西
内容字数:5422字
DeepMind AlphaGeometry2:几何题解题能力超越IMO金牌得主
谷歌DeepMind近日发布了其升级版AI系统AlphaGeometry2,该系统在解决国际数学奥林匹克竞赛(IMO)几何问题上的表现超越了金牌得主的平均水平。这标志着AI在数学推理和逻辑证明能力上取得了显著进展,也为通用人工智能(AGI)的研究提供了新的思路。
1. AlphaGeometry2的工作机制
AlphaGeometry2的核心在于融合了神经网络和符号AI两种方法。它利用谷歌Gemini系列语言模型(神经网络架构)预测几何题中需要添加的辅助线,再由符号引擎(基于规则的系统)根据这些辅助线进行逻辑推理和证明。 Gemini模型以形式化的数学语言为符号引擎提供建议,符号引擎则检查这些步骤的逻辑性。系统还配备了并行搜索算法和公共知识库,提高了效率和准确性。为了训练模型,DeepMind还创建了一个包含超过3亿个定理和证明的合成数据集。
2. AlphaGeometry2的优异表现
AlphaGeometry2在过去25年IMO的45道几何题中成功解决了42道,得分超过了金牌得主的平均分。 虽然在另一组更难的题目中表现略逊,但其在大规模题集上的出色表现依然令人瞩目。这使其成为第一个在如此大规模题集上达到IMO金牌水平的AI系统,并显著优于OpenAI的o1推理模型。
3. 神经网络与符号AI的融合
AlphaGeometry2的成功为神经网络和符号AI之争提供了新的视角。神经网络派认为智能行为可通过大量数据和计算自发涌现,而符号AI派则强调规则和符号操作的重要性。AlphaGeometry2的混合方法证明了两种方法的结合能有效提升AI的推理能力。虽然AlphaGeometry2的语言模型有时可以在没有符号引擎辅助的情况下生成部分解决方案,但DeepMind团队认为,在模型速度和可靠性进一步提升前,符号引擎等外部工具仍然至关重要。
4. 未来的挑战与展望
尽管AlphaGeometry2取得了令人瞩目的成就,但在处理一些简单常识问题上,AI系统仍然存在不足。未来的研究需要关注如何提高AI系统在简单任务上的准确性,拓展其处理复杂任务的能力,并降低开发和部署成本。 DeepMind的研究为AGI的探索提供了新的方向,但同时也提醒我们,AI技术仍有很大的发展空间,需要持续的研究和改进。
联系作者
文章来源:智东西
作者微信:
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。