gstack

gstack – YC CEO开源的 AI 编程工作流工具

gstack，一款由 Y Combinator 总裁兼 CEO Garry Tan 倾力打造的开源工具集，旨在革新 Claude Code 的使用方式。它将强大的 AI 助手转化为一支高效的虚拟工程团队，通过模拟 15 位专业角色和 6 种增强工具，以简便的斜杠命令驱动整个开发流程。gstack 不仅支持并行处理多达 10-15 个 Sprint，更能实现真实的浏览器自动化、AI 间的交叉审查以及文档的自动更新。

gstack 的核心功能亮点

产品重塑：借助 /office-hours 命令，通过一系列精炼的提问，深入剖析产品设想，挑战固有观念，并生成切实可行的实现路径。
规划审视：/plan-ceo-review 命令从高层视角审视项目需求；/plan-eng-review 则专注于架构和测试矩阵的完善；而 /plan-design-review 则会进行评分并识别潜在的 AI 生成内容质量问题。
设计体系构建：/design-consultation 命令能够从零开始构建一套完整的设计体系，并生成逼真的原型图及 DESIGN.md 文档。
代码审计与修复：/review 命令能够精准定位生产环境中的潜在风险并尝试自动修复；/investigate 则进行系统性的根因分析，并在三次尝试失败后中断。
设计缺陷修正：/design-review 命令在完成审计后，将直接着手修复问题，以原子化的提交方式进行，并生成直观的前后对比截图。
质量保障流程：/qa 命令执行真实的浏览器测试，自动修复发现的 bug，并生成回归测试用例；/qa-only 则仅生成测试报告，不修改代码。
安全合规审查：/cso 命令执行 OWASP Top 10 安全标准和 STRIDE 威胁建模，并提供具体的攻击场景分析。
发布与部署自动化：/ship 命令实现代码同步、测试、Pull Request 开启的一站式操作；/land-and-deploy 则在代码合并后自动部署并验证生产环境健康；/canary 用于监控发布后的错误和性能表现。
浏览器自动化能力：/browse 命令能够操控真实的 Chromium 浏览器进行点击、截图等操作；/setup-browser-cookies 则支持导入真实浏览器 cookie。
双 AI 交叉验证机制：/codex 命令引入 OpenAI Codex 进行的审查，与 Claude 形成互补，发现潜在的盲点。
团队绩效复盘：/retro 命令生成周度工程报告，涵盖个人数据、发布连续性和测试趋势等关键指标。
安全防护指令：/careful 在执行可能具有破坏性的命令前发出警告；/freeze 用于锁定编辑范围；/guard 则整合了前两者的功能，提供全面的安全保障。
效率提升工具：/autoplan 命令能够一键串联 CEO、设计和工程审查流程；/document-release 自动同步文档与代码变更；/gstack-upgrade 实现工具自身的更新迭代。

gstack 的关键信息与使用前提

开发者：Garry Tan，Y Combinator 的总裁兼 CEO。
核心价值：将 Claude Code 升级为具备多重专业角色的虚拟工程团队。
量化成果：在 60 天内处理了 60 万行代码，日均产出 1-2 万行，同时并行管理 10-15 个 Sprint。
组成部分：包含 15 个专业角色和 6 个增强工具，所有操作均通过斜杠命令触发。
必备软件：Claude Code、Git、Bun v1.0 及以上版本。
Windows 用户特别提示：需要安装 Node.js，因为 Bun 在 Windows 上可能存在 Playwright 兼容性问题，届时会自动回退至 Node.js。
安装便捷性：安装过程仅需约 30 秒。
配置要求：需要在项目 CLAUDE.md 文件中添加 gstack 的技能列表。
浏览器支持：可选 Chrome、Arc、Brave 或 Edge 浏览器用于 cookie 导入。

gstack 的卓越优势所在

流程结构化：能够将零散的 AI 指令转化为完整的 Sprint 流程，涵盖思考、规划、构建、审查、测试和发布等环节，有效避免输出的混乱。
角色专业分工：15 个专家角色各司其职，如同真实团队般协作：CEO 负责方向把握，Staff 工程师专注于 bug 修复，QA 负责人则使用真实浏览器进行流程测试。
强大的并行处理能力：支持同时运行 10-15 个的 Sprint，其管理模式如同 CEO 管理团队，关键决策介入，其余流程自动推进。
真实的浏览器交互：/browse 命令能操控真实的 Chromium 浏览器，实现用户在界面上的真实点击、截图操作，甚至处理验证码，让 AI 真正“看见”并理解界面。
双 AI 交叉验证机制：/codex 命令引入 OpenAI Codex 进行审查，与 Claude 进行交叉比对，从而发现潜在的盲点，显著提升代码质量。
自动化修复闭环：/qa 命令在发现 bug 后，能够自动修复、生成回归测试并重新验证，实现无需人工干预的完整修复流程。

如何高效利用 gstack

环境部署：在 Claude Code 中执行安装命令，系统将自动克隆仓库、编译二进制文件并将所有技能注册到本地。
项目适配：若需团队共享，将 gstack 复制到项目内的 .claude/skills/ 目录，并重新运行 setup。随后，在 CLAUDE.md 文件中添加技能列表，以便 Claude 识别。
产品启动（/office-hours）：描述您的产品设想，AI 将挑战您的表述框架、质疑前提假设、挖掘隐藏需求，并生成设计文档，自动传递给后续的处理流程。
规划审查（/plan-ceo-review 等）：依次执行 CEO 审查以确定方向，工程审查以锁定架构，设计审查以评估可行性，通过三层把关确保方案无误后再进入开发阶段。
代码实现（自动或手动）：在规划获批后，AI 将根据设计文档自动编写代码，或者您也可以手动开发，完成后再进入审查环节。
质量检验（/review + /qa）：运行 /review 命令查找生产环境中的潜在问题并尝试自动修复，接着运行 /qa 命令，利用真实浏览器进行点击测试，发现 bug 后自动修复并生成回归测试。
发布上线（/ship）：执行 /ship 命令，实现主分支代码同步、测试运行、覆盖率审计、代码推送以及 Pull Request 的自动开启，完成整个发布流程。
持续迭代（/retro + /gstack-upgrade）：定期运行 /retro 命令进行团队数据复盘，并运行 /gstack-upgrade 命令实现工具自身的更新，获取最新功能。

gstack 的项目源码地址

GitHub 仓库：https://github.com/garrytan/gstack

gstack 与同类竞品之比较

维度	gstack	OpenAI Codex	Devin (Cognition)
定位	Claude Code 的虚拟工程团队工作流	OpenAI 官方 CLI 代码助手	全自主 AI 软件工程师
核心形态	15个专家角色 + 6个工具，斜杠命令调用	单一会话式命令行工具	云端 Agent，端到端开发
工作流	结构化 Sprint（思考→规划→构建→审查→测试→发布）	对话，无固定流程	自主规划执行，人工介入少
并行能力	支持 10-15 个 Sprint 同时运行	单会话	单任务
代码审查	`/review` + `/codex` 双 AI 交叉验证	自身审查	自主测试验证
浏览器测试	`/browse` 真实 Chromium 自动化	无	内置浏览器自动化
团队协作	通过 `.claude/skills/` 共享配置	个人使用	企业级，按席位付费