GenericAgent

GenericAgent – A3 Lab 推出的通用自进化 LLM Agent 系统

GenericAgent（GA）是 A3 Lab 倾力打造的一款通用自进化大型语言模型（LLM）智能体系统。其核心设计理念在于“上下文信息密度最大化”，旨在通过精巧的架构和高效的机制，在有限的上下文窗口内实现最佳的信息利用率。GA 集成了 9 个原子级工具，拥有 30k 的庞大上下文窗口，并构建了四层分层记忆体系，在 Lifelong AgentBench 基准测试中取得了令人瞩目的 100% 任务完成率，同时 token 消耗量仅为 Claude Code 的 27.7%，OpenClaw 的 15.5%。

GenericAgent 究竟是什么？

GenericAgent（GA）是由 A3 Lab 推出的通用自进化 LLM Agent 系统，其核心设计遵循“上下文信息密度最大化”的原则。GA 巧妙地融合了 9 个原子工具、30k 的上下文窗口以及四层分层记忆架构，在 Lifelong AgentBench 评测中实现了 100% 的任务完成率，并且显著降低了 token 消耗，仅为 Claude Code 的 27.7% 和 OpenClaw 的 15.5%。更令人称道的是，GA 能够将经验沉淀为可复用的标准操作程序（SOP）和可执行代码，具备跨任务的自进化能力。其核心代码量仅为 3300 行，并且以自托管命令行界面（CLI）的形式运行，部署灵活便捷。

GenericAgent 的核心功能亮点

精简高效的原子工具集：GA 提供了 file_read、file_patch、file_write、code_run、web_scan、web_execute_js、update_working_checkpoint、start_long_term_update、ask_user 共计 9 个原子工具。这些工具覆盖了文件操作、代码执行、网页交互、记忆管理以及人工干预等关键能力领域，构成了一个强大而紧凑的工具箱。
分层按需的记忆机制：GA 采用 L0 元规则、L1 索引层、L2 事实层、L3 SOP 层、L4 原始归档层的四级记忆架构。其中，L1 索引层作为常驻上下文，而深层记忆则采取按需显式读取的方式，确保信息检索的及时性和高效性。
强大的自进化能力：GA 能够将经过验证的执行轨迹转化为可复用的 SOP 文件和可执行脚本。秉持“无执行，无记忆”的原则，它实现了跨任务的经验累积和能力的持续进化，让智能体越用越聪明。
智能上下文压缩管理：通过工具输出截断、标签级压缩、消息驱逐和工作记忆锚点这四重策略，GA 能够将活跃上下文始终控制在 30k token 的预算范围内，避免信息过载。
双模式执行引擎：GA 支持 Interact 模式，用于处理用户主动发起的任务；同时具备 Reflect 模式，能够作为“监视者”自动监测环境变化并主动触发任务，实现更智能化的响应。

GenericAgent 的技术原理剖析

上下文信息密度最大化：GA 将上下文的质量分解为完整性（Completeness）、简洁性（Conciseness）和自然性（Naturalness）三个维度。通过整合极简工具、分层记忆、自进化机制以及上下文压缩策略，GA 在有限的上下文窗口内最大限度地提升了决策相关信息的比例。
工具最小化与组合泛化：GA 基于“原子性”（不可再拆分）和“组合泛化”（复杂行为通过序列组合实现）的原则，仅保留了 9 个原子工具。这一策略有效避免了工具数量膨胀带来的 prompt 开销和策略歧义问题。
分层记忆架构的精妙之处：L1 索引层仅记录“某类知识的存在”，而非具体内容，由 LLM 作为解码器按需检索。引入的 meta-memory 元记忆层负责定义全局规则和更新边界。采用触发式提交而非即时写入，确保只有经过验证的经验才会被增量写入长期记忆。
自进化管道的保障：工具层与知识层相互，新任务的学习不会干扰现有技能。在里程碑触发的整合阶段，只保留经过成功工具执行验证的内容。引入的失败升级机制（局部修复→策略切换→人工介入）有效防止了错误循环的发生。
四阶段上下文截断的策略：阶段一按字符阈值裁剪工具返回值；阶段二每约 5 轮替换重复的工作记忆块并截断标签内容；阶段三按先进先出（FIFO）原则驱逐最旧的消息；阶段四附加工作记忆锚点作为长期记忆的唯一入口。

如何开始使用 GenericAgent

环境准备：首先，请确保您的本地环境已安装 Python 运行环境，并准备好兼容的 LLM API Key（支持 Claude、GPT、Gemini 等多种后端模型）。
获取代码：您可以通过论文发布渠道（arXiv:2604.17091）获取约 3300 行的核心源码及详细的部署指南。
配置与安装：在本地完成依赖库的安装，并配置好 LLM 后端。请设定 30k token 的上下文预算和相应的字符预算阈值。
启动运行：以自托管 CLI 的形式启动 GA。进入 Interact 模式后，您可以直接输入任务指令；或者配置 Reflect 模式的触发脚本，实现自动化环境监测。
任务执行流程：Agent 将根据当前任务和相关记忆构建执行上下文，生成工具调用或输出。通过结构化的反馈，系统状态将得到更新。
经验的沉淀与复用：任务完成后，系统会自动将验证后的执行轨迹进行压缩并归档至 L4。经过触发整合后，这些经验将沉淀为 L2/L3 的长期记忆，供后续任务复用，实现能力的持续提升。

GenericAgent 的关键信息与使用要求

开发团队：GenericAgent 由 A3 Lab（Advantage AI Agent Lab，深圳 Aquaintelling 科技与复旦大合研究团队）精心开发。
开源形态：核心代码量约 3300 行，其中 Agent Loop 仅 92 行。它以自托管 CLI 程序的形式部署，提供原生的命令行执行界面。
模型兼容性：GA 采用模型无关架构，支持 Claude、GPT、Gemini 等主流 LLM 后端，更换模型不会影响执行逻辑和工具接口。
上下文预算管理：默认将活跃上下文控制在 30k token 以内，采用字符域启发式（α≈3 chars/token）进行预算管理。
执行边界设定：单会话默认执行上限为 30 轮，支持通过子 Agent 派发实现多进程隔离和长程任务拆分。
使用门槛说明：用户需要配置 LLM API Key，并具备本地计算环境的运行权限。该系统更适合有技术背景的用户进行自托管部署。

GenericAgent 的核心优势凸显

极致的 Token 效率：在 Lifelong AgentBench 上，GA 仅用 222k 输入 token 实现了 100% 的任务完成率。相比 Claude Code 降低了 72.3%，较 OpenClaw 更是降低了 84.5%，展现了卓越的资源利用能力。
持续的自进化能力：经过 9 轮重复任务后，GA 的 token 消耗下降了 89.6%，LLM 调用次数从 32 次收敛至 5 次。这种“冷启动-快速收敛”的复利效应，使其能力不断增强。
极简的架构设计：GA 的核心代码量仅为 3300 行，而 OpenClaw 则高达 53 万行。这种极简设计不仅易于理解和维护，更赋予了 Agent 潜在的自我理解和修改自身架构的能力。
高密度记忆的优势：当装载 20 个技能后，GA 的完整 prompt 仅需 2298 token，远低于 Claude Code（22821）、Codex（23932）、OpenClaw（43321），内存占用显著降低。
强大的网页交互能力：在 WebCanvas、BrowseComp-ZH、Custom Tasks 等网页交互评测中，GA 的得分均超过 OpenClaw，且 token 消耗仅为其 1/4 至 1/3，在网页浏览任务上表现出色。

GenericAgent 的项目地址

GitHub 仓库：https://github.com/lsdefine/GenericAgent
arXiv 技术论文：https://arxiv.org/pdf/2604.17091

GenericAgent 与同类竞品对比

维度	GenericAgent	OpenClaw	Claude Code
核心代码量	~3，300 行	~530，000 行	未公开
原子工具数	9 个	18 个工具工厂 + 插件	53 个
上下文策略	30k 压缩窗口	依赖 1M 扩展窗口	依赖长上下文
Lifelong AgentBench 完成率	100%	70%	75%
Lifelong AgentBench 输入 Token	222k	1.43M	800k
自进化能力	经验沉淀为 SOP/代码	无显著收敛趋势	无跨会话记忆
记忆架构	四层分层按需加载	检索增强原始日志	无持久记忆
网页浏览 Token 效率	0.18M (WebCanvas)	0.71M	未评测