GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统
GBrain:Y Combinator 总裁打造的性AI记忆系统
GBrain,这一由 Y Combinator 总裁 Garry Tan 倾力打造并开源的个人生产级AI记忆系统,正以前所未有的方式重塑我们与AI的互动。它专为 OpenClaw、Hermes Agent 等先进AI Agent平台量身定制,旨在将零散的Markdown笔记转化为一个动态、可搜索、可推理且持续进化的知识图谱,赋予AI Agent强大的长期记忆能力。Garry Tan 本人已成功运用GBrain管理超过10000份文件、3000位人脉以及13年的日历数据。该系统内部已构建起一个庞大的信息网络,包含17888个页面、4383位人物、723家公司,更有21项定时任务全自动运行,而这一切的搭建仅耗时12天。
GBrain的核心能力概览
- 智能信息捕捉:系统能够实时捕捉每一条信息流,通过廉价模型并行提取原创观点和关键实体,并自动在后台进行归档,确保信息的即时性和完整性。
- 优先信息检索:在AI Agent生成回答前,GBrain会优先查询其内部知识库。若信息无法找到,Agent将直接告知用户,而非凭空捏造,有效避免了“幻觉”现象。
- 多维度内容整合:GBrain支持对会议记录、电子邮件、社交媒体动态(如Twitter)、PDF文档、视频内容乃至GitHub代码仓库等全格式信息的自动化消化与整合。
- 实体信息动态升级:对于识别出的人物或公司实体,GBrain会根据其被提及的频率自动进行信息层级的升级:初次提及为“存根”状态;三次提及后,系统会尝试联网补充相关信息;达到八次提及或在会议现时,则会生成一份详尽的档案。
- “已编译”与“时间线”双层知识模型:GBrain的上层结构“已编译”代表了当前对某事物的最佳理解,并可根据新证据进行修改;下层“时间线”则是一个只追加、永不删除的原始证据链。这种设计兼顾了认知的演进与完整的审计追踪。
- 混合搜索技术:结合了向量搜索、关键词匹配、RRF(Reciprocal Rank Fusion)融合、多查询扩展以及四层去重机制,GBrain的搜索召回率(Recall@5)高达95%,确保了信息的精准定位。
- 知识图谱的自主连接:在每次写入新信息时,GBrain无需调用LLM即可自动提取实体间的关系(如“参与了”、“任职于”、“投资了”等),并完成去重和失效链接的清理,实现知识图谱的自动化构建。
- “Minions”后台任务队列:对于确定性的后台任务,GBrain利用Postgres的内置作业队列,实现了753毫秒的超快完成速度,且零Token成本,成功率100%。
- “Skillify”技能管理系统:自动生成SKILL.md文件、测试用例、评估报告以及解析器触发器,有效防止技能树的黑箱化,保证AI Agent能力的透明与可控。
- 语音通话集成:通过集成Twilio和OpenAI Realtime技术,GBrain能够自动接听语音来电,拉取对方的档案信息,并生成详尽的通话记录与分析。
- 个性化每日简报:系统能够自动汇总当日的会议上下文、活跃交易、重要引用追踪以及待办事项,为用户提供高效的日间信息概览。
GBrain的技术基石
- 三层分离式架构:GBrain采用了“Brain Repo”(以Git托管的Markdown文件,作为人类可读写的唯一数据源)、“GBrain检索层”(基于Postgres与pgvector的混合搜索引擎)以及“AI Agent”(包含26个Skill定义,负责读写逻辑)的三层分离架构。Agent通过BrainEngine接口进行数据交互,底层支持PGLite(无需配置的嵌入式Postgres)和PostgresEngine(Supabase),并可实现双向热迁移。
- “已编译”与“时间线”双层知识模型:每个Markdown文件均以
---分隔为两部分。上层“已编译”代表当前最精炼的认知,可随新证据的出现而更新;下层“时间线”则记录了所有原始证据,且只增不删。这种结构保证了认知的动态发展,同时保留了完整的历史审计路径,避免了纯粹覆盖更新导致的历史丢失或纯粹追加带来的查询噪音。 - 零LLM调用的知识图谱自连接:每次页面写入后,GBrain依靠确定的正则化管道自动提取实体引用(包括Markdown链接和露的slug),推断出类型化的关系(如“attended”、“works_at”、“invested_in”等),并自动完成去重、失效链接清理及反向链接更新。整个过程完全不依赖LLM调用,仅通过本地正则匹配和优先级推断实现。
GBrain的简易使用指南
- Agent自动化安装(推荐方式):在OpenClaw或Hermes Agent环境中,直接粘贴指令
Retrieve and follow the instructions at: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md。Agent将自动完成仓库克隆、依赖安装、26个Skill加载以及定时任务配置,整个过程预计30分钟。 - 命令行工具:通过
git clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link命令克隆并安装。随后,使用gbrain init初始化本地大脑(基于PGLite,2秒即可就绪),通过gbrain import ~/notes/导入您的笔记,并使用gbrain query "..."进行查询。 - MCP服务器部署:通过本地命令
gbrain serve可以暴露30余个MCP工具,方便接入Claude Code、Cursor、Windsurf等工具。远程部署至Supabase后,通过ngrok固定域名,可接入Claude Desktop、Cowork、Perplexity等。 - 数据源接入配置:运行
gbrain integrations命令,您可以查看并配置Gmail、日历、Twitter、会议转录等各类集成选项。
GBrain的关键特性与使用门槛
- 环境要求:需要安装Node.js和Bun(推荐)。本地运行可选择零配置的PGLite,若需多设备同步,则需配置Supabase Postgres(月费约25美元)。
- API密钥配置:需要配置OpenAI(用于嵌入式模型)、Anthropic(可选,用于子Agent)、Groq(用于语音转录)等API密钥。
- 数据存储与同步:Markdown文件是GBrain的唯一数据源,用户可直接编辑。运行
gbrain sync即可实现自动同步。 - 与GStack的关系:GStack(拥有8万+ Star)专注于教授Agent编写代码,而GBrain则负责教会Agent记忆与思考。两者可通过
hosts/gbrain.ts进行桥接,实现功能融合。 - 许可协议:GBrain采用MIT开源协议,允许商业使用。
GBrain的突出优势
- 生产级验证的可靠性:作为YC总裁的日常工作流工具,GBrain经过真实生产环境的严格考验,而非简单的演示Demo。
- 自进化的知识图谱:其知识图谱关系自动提取过程无需LLM调用,相比纯向量搜索,信息检索精度提升了28.8个百分点。
- 确定性的后台任务处理:Minions将确定性任务与判断性任务分离,将每次任务成本从0.03美元降至0美元,成功率从0%提升至100%。
- 分层知识模型保障信息完整性:Compiled Truth确保认知实时演进,Timeline则保证了证据链的永不丢失。
- 面向Agent的原生设计:GBrain在安装、运维及扩展等方面均针对AI Agent进行了优化,而非以人工操作为中心。
GBrain项目一览
- 项目官方仓库:https://github.com/garrytan/gbrain
GBrain与同类产品的横向对比
以下表格展示了GBrain与Mem0、LlamaIndex、Pinecone等竞品在关键维度上的对比:
| 对比维度 | GBrain | Mem0 | LlamaIndex | Pinecone |
|---|---|---|---|---|
| 核心定位 | AI Agent的长期记忆系统 | 个性化AI记忆层 | LLM应用的数据框架 | 向量数据库 |
| 知识图谱能力 | 原生自连接,零LLM调用 | 无原生图谱 | 需手动构建RAG图谱 | 无,纯向量存储 |
| 实体信息自动升级 | 按提及次数自动升级 | 基于用户交互记忆 | 需开发者配置 | 不涉及 |
| 搜索策略 | 向量+关键词+RRF+图谱遍历 | 向量搜索为主 | 多种检索器可选 | 纯向量/混合搜索 |
| Agent集成度 | OpenClaw/Hermes/MCP原生支持 | 多框架SDK支持 | LangChain/LlamaIndex集成 | 需自行封装 |
| 后台任务处理 | Minions原生队列,零Token成本 | 无原生队列 | 无 | 无 |
| 数据格式 | Markdown为唯一源 | 多格式API摄入 | 多格式节点 | 向量嵌入 |
| 开源许可 | MIT | Apache 2.0 | MIT | 商业/开源混合 |
| 生产验证程度 | YC总裁1.7万页生产环境实践 | 多家公司应用 | 广泛企业级采用 | 广泛企业级采用 |
| 安装简易性 | Agent自装30分钟/CLI | pip安装SDK | pip安装 | 云托管/自托管 |
GBrain的典型应用场景
- 投资人与创始人关系管理:系统可自动归档会议记录、邮件往来及社交动态,并在会前30秒内生成对方的完整档案及过往互动摘要。
- 个人知识体系构建:将个人多年的笔记、文章和想法转化为可供AI推理的知识图谱,轻松应对“我半年前对某事的看法”这类查询。
- 研究过程自动化:通过摄入论文、报告、视频等资料,GBrain能自动提炼关键实体、建立引用关系并生成时间线,极大地辅助学术或行业研究。
- 内容创作的有力助手:系统能够追踪灵感来源、自动补全引用信息,并维护主题标签的一致性,有效防止创作过程中的信息遗漏。
- 智能日程与任务管理:每日自动生成会议简报,检查过期页面,修复损坏的引用,并生成周期性报告,实现高效的日程与任务自动化。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



粤公网安备 44011502001135号