GBrain

GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统

GBrain：Y Combinator 总裁打造的性AI记忆系统

GBrain，这一由 Y Combinator 总裁 Garry Tan 倾力打造并开源的个人生产级AI记忆系统，正以前所未有的方式重塑我们与AI的互动。它专为 OpenClaw、Hermes Agent 等先进AI Agent平台量身定制，旨在将零散的Markdown笔记转化为一个动态、可搜索、可推理且持续进化的知识图谱，赋予AI Agent强大的长期记忆能力。Garry Tan 本人已成功运用GBrain管理超过10000份文件、3000位人脉以及13年的日历数据。该系统内部已构建起一个庞大的信息网络，包含17888个页面、4383位人物、723家公司，更有21项定时任务全自动运行，而这一切的搭建仅耗时12天。

GBrain的核心能力概览

智能信息捕捉：系统能够实时捕捉每一条信息流，通过廉价模型并行提取原创观点和关键实体，并自动在后台进行归档，确保信息的即时性和完整性。
优先信息检索：在AI Agent生成回答前，GBrain会优先查询其内部知识库。若信息无法找到，Agent将直接告知用户，而非凭空捏造，有效避免了“幻觉”现象。
多维度内容整合：GBrain支持对会议记录、电子邮件、社交媒体动态（如Twitter）、PDF文档、视频内容乃至GitHub代码仓库等全格式信息的自动化消化与整合。
实体信息动态升级：对于识别出的人物或公司实体，GBrain会根据其被提及的频率自动进行信息层级的升级：初次提及为“存根”状态；三次提及后，系统会尝试联网补充相关信息；达到八次提及或在会议现时，则会生成一份详尽的档案。
“已编译”与“时间线”双层知识模型：GBrain的上层结构“已编译”代表了当前对某事物的最佳理解，并可根据新证据进行修改；下层“时间线”则是一个只追加、永不删除的原始证据链。这种设计兼顾了认知的演进与完整的审计追踪。
混合搜索技术：结合了向量搜索、关键词匹配、RRF（Reciprocal Rank Fusion）融合、多查询扩展以及四层去重机制，GBrain的搜索召回率（Recall@5）高达95%，确保了信息的精准定位。
知识图谱的自主连接：在每次写入新信息时，GBrain无需调用LLM即可自动提取实体间的关系（如“参与了”、“任职于”、“投资了”等），并完成去重和失效链接的清理，实现知识图谱的自动化构建。
“Minions”后台任务队列：对于确定性的后台任务，GBrain利用Postgres的内置作业队列，实现了753毫秒的超快完成速度，且零Token成本，成功率100%。
“Skillify”技能管理系统：自动生成SKILL.md文件、测试用例、评估报告以及解析器触发器，有效防止技能树的黑箱化，保证AI Agent能力的透明与可控。
语音通话集成：通过集成Twilio和OpenAI Realtime技术，GBrain能够自动接听语音来电，拉取对方的档案信息，并生成详尽的通话记录与分析。
个性化每日简报：系统能够自动汇总当日的会议上下文、活跃交易、重要引用追踪以及待办事项，为用户提供高效的日间信息概览。

GBrain的技术基石

三层分离式架构：GBrain采用了“Brain Repo”（以Git托管的Markdown文件，作为人类可读写的唯一数据源）、“GBrain检索层”（基于Postgres与pgvector的混合搜索引擎）以及“AI Agent”（包含26个Skill定义，负责读写逻辑）的三层分离架构。Agent通过BrainEngine接口进行数据交互，底层支持PGLite（无需配置的嵌入式Postgres）和PostgresEngine（Supabase），并可实现双向热迁移。
“已编译”与“时间线”双层知识模型：每个Markdown文件均以---分隔为两部分。上层“已编译”代表当前最精炼的认知，可随新证据的出现而更新；下层“时间线”则记录了所有原始证据，且只增不删。这种结构保证了认知的动态发展，同时保留了完整的历史审计路径，避免了纯粹覆盖更新导致的历史丢失或纯粹追加带来的查询噪音。
零LLM调用的知识图谱自连接：每次页面写入后，GBrain依靠确定的正则化管道自动提取实体引用（包括Markdown链接和露的slug），推断出类型化的关系（如“attended”、“works_at”、“invested_in”等），并自动完成去重、失效链接清理及反向链接更新。整个过程完全不依赖LLM调用，仅通过本地正则匹配和优先级推断实现。

GBrain的简易使用指南

Agent自动化安装（推荐方式）：在OpenClaw或Hermes Agent环境中，直接粘贴指令Retrieve and follow the instructions at: https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md。Agent将自动完成仓库克隆、依赖安装、26个Skill加载以及定时任务配置，整个过程预计30分钟。
命令行工具：通过git clone https://github.com/garrytan/gbrain.git && cd gbrain && bun install && bun link命令克隆并安装。随后，使用gbrain init初始化本地大脑（基于PGLite，2秒即可就绪），通过gbrain import ~/notes/导入您的笔记，并使用gbrain query "..."进行查询。
MCP服务器部署：通过本地命令gbrain serve可以暴露30余个MCP工具，方便接入Claude Code、Cursor、Windsurf等工具。远程部署至Supabase后，通过ngrok固定域名，可接入Claude Desktop、Cowork、Perplexity等。
数据源接入配置：运行gbrain integrations命令，您可以查看并配置Gmail、日历、Twitter、会议转录等各类集成选项。

GBrain的关键特性与使用门槛

环境要求：需要安装Node.js和Bun（推荐）。本地运行可选择零配置的PGLite，若需多设备同步，则需配置Supabase Postgres（月费约25美元）。
API密钥配置：需要配置OpenAI（用于嵌入式模型）、Anthropic（可选，用于子Agent）、Groq（用于语音转录）等API密钥。
数据存储与同步：Markdown文件是GBrain的唯一数据源，用户可直接编辑。运行gbrain sync即可实现自动同步。
与GStack的关系：GStack（拥有8万+ Star）专注于教授Agent编写代码，而GBrain则负责教会Agent记忆与思考。两者可通过hosts/gbrain.ts进行桥接，实现功能融合。
许可协议：GBrain采用MIT开源协议，允许商业使用。

GBrain的突出优势

生产级验证的可靠性：作为YC总裁的日常工作流工具，GBrain经过真实生产环境的严格考验，而非简单的演示Demo。
自进化的知识图谱：其知识图谱关系自动提取过程无需LLM调用，相比纯向量搜索，信息检索精度提升了28.8个百分点。
确定性的后台任务处理：Minions将确定性任务与判断性任务分离，将每次任务成本从0.03美元降至0美元，成功率从0%提升至100%。
分层知识模型保障信息完整性：Compiled Truth确保认知实时演进，Timeline则保证了证据链的永不丢失。
面向Agent的原生设计：GBrain在安装、运维及扩展等方面均针对AI Agent进行了优化，而非以人工操作为中心。

GBrain项目一览

项目官方仓库：https://github.com/garrytan/gbrain

GBrain与同类产品的横向对比

以下表格展示了GBrain与Mem0、LlamaIndex、Pinecone等竞品在关键维度上的对比：

对比维度	GBrain	Mem0	LlamaIndex	Pinecone
核心定位	AI Agent的长期记忆系统	个性化AI记忆层	LLM应用的数据框架	向量数据库
知识图谱能力	原生自连接，零LLM调用	无原生图谱	需手动构建RAG图谱	无，纯向量存储
实体信息自动升级	按提及次数自动升级	基于用户交互记忆	需开发者配置	不涉及
搜索策略	向量+关键词+RRF+图谱遍历	向量搜索为主	多种检索器可选	纯向量/混合搜索
Agent集成度	OpenClaw/Hermes/MCP原生支持	多框架SDK支持	LangChain/LlamaIndex集成	需自行封装
后台任务处理	Minions原生队列，零Token成本	无原生队列	无	无
数据格式	Markdown为唯一源	多格式API摄入	多格式节点	向量嵌入
开源许可	MIT	Apache 2.0	MIT	商业/开源混合
生产验证程度	YC总裁1.7万页生产环境实践	多家公司应用	广泛企业级采用	广泛企业级采用
安装简易性	Agent自装30分钟/CLI	pip安装SDK	pip安装	云托管/自托管