DGM

DGM – 自改进AI Agent系统，会迭代修改自身代码提升性能

DGM

DGM (Darwin Gödel Machine) 是一款自进化人工智能系统，它通过不断迭代修改自身代码来提高性能。DGM 从其维护的编码代理库中挑选一个代理，利用基础模型生成新版本，并在编码基准测试中检验其性能。如果新代理表现更出色，就会被添加到代理库中。

## 揭秘 DGM：自进化人工智能的先锋

DGM，全称 Darwin Gödel Machine，正如其名，灵感源于达尔文进化论和哥德尔不完备性定理。它是一个**自我改进的人工智能系统**，其核心在于**通过迭代修改自身代码来持续提升性能**。DGM 就像一个不断学习、自我完善的“程序员”，它从自身维护的编码代理档案中挑选一个“蓝本”，基于基础模型生成新版本，然后在编码基准测试中进行严格的“实战”检验。如果新版本表现更优异，就会被加入到档案中，从而不断壮大自身的“知识库”。

### 核心功能：让 AI 变得更强大

DGM 拥有多项令人瞩目的核心功能，使其在人工智能领域独树一帜：

* **自我优化**：DGM 能够不断地修改自身代码，实现性能和功能的优化。通过自我修改模块读取自身源代码，并基于基础模型生成修改建议，让 AI 变得更聪明。
* **实证检验**：每次代码修改都会经过严格的编码基准测试（如 SWE-bench 和 Polyglot）验证，确保每次改进都真实有效。评估引擎在 Docker 容器中进行隔离和评估，确保结果的可靠性。
* **开放探索**：DGM 秉承达尔文进化论的理念，采用开放性探索策略，从不同的起点探索多种进化路径，避免陷入局部最优解。它维护一个编码代理档案，不断积累生成的变体，支持从档案中的任何代理分支出新的进化路径。
* **安全护航**：DGM 的执行和自我修改过程都在隔离的沙盒环境中进行，从而最大程度地降低了对宿主系统的潜在影响，确保了系统的安全性。

### 工作原理：AI 进化的“秘诀”

DGM 的工作流程可以概括为以下三个关键阶段：

1. **自修改阶段**：DGM 从其维护的编码代理（coding agents）档案中选择一个代理，并利用基础模型（foundation model）生成该代理的一个新版本。
2. **验证阶段**：新生成的代理在编码基准测试中接受严格的评估，以确定其性能是否有所提升。
3. **档案更新**：经过验证的改进代理会被添加到档案中，档案不断积累所有生成的变体，为未来的进化奠定基础。

### 探索 DGM 的世界

* **官方网站：**由于没有提品官网，请您关注 DGM 的 Github 仓库和 arXiv 论文，以获取最新的信息。
* **Github 仓库：**https://github.com/jennyzzt/dgm
* **arXiv 技术论文：**https://arxiv.org/pdf/2505.22954

### 应用场景：无限可能

DGM 在多个领域展现出巨大的潜力：

* **自动化编程**：DGM 可以自动生成和优化代码，减轻开发人员的负担，提高编程效率。通过自我改进生成更高效的代码，提升软件的整体性能。
* **代码优化**：DGM 能够自动检测代码中的问题并进行优化，提高代码的可读性和执行效率。通过不断迭代改进，DGM 能生成更优的代码版本，减少开发时间和成本。
* **自动修复**：DGM 通过自我进化可以自动修复发现的问题，降低软件维护成本。能识别代码中的潜在问题，生成修复方案，减少人工干预。
* **研究平台**：DGM 为研究自我改进系统提供了实践平台，有助于学术界对该领域的研究。研究人员可以用 DGM 探索新的算法和模型，推动人工智能技术的发展。

### 常见问题

* **DGM 的安全性如何保障？** DGM 的执行和自我修改过程都在隔离的沙盒环境中进行，限制对宿主系统的影响，确保了安全性。
* **DGM 的性能提升有多大？** 在实验中，DGM 在多个基准测试中的性能显著提升，例如在 SWE-bench 基准测试中性能从 20.0% 提升至 50.0%，在 Polyglot 基准测试中从 14.2% 提升至 30.7%。
* **DGM 的未来发展方向是什么？** 随着技术的不断进步，DGM 有望在更多领域发挥作用，例如在软件开发、代码维护、问题修复等方面。

阅读原文