gstack

gstack – YC CEO开源的 AI 编程工作流工具

gstack,一款由 Y Combinator 总裁兼 CEO Garry Tan 倾力打造的开源工具集,旨在革新 Claude Code 的使用方式。它将强大的 AI 助手转化为一支高效的虚拟工程团队,通过模拟 15 位专业角色和 6 种增强工具,以简便的斜杠命令驱动整个开发流程。gstack 不仅支持并行处理多达 10-15 个 Sprint,更能实现真实的浏览器自动化、AI 间的交叉审查以及文档的自动更新。

gstack 的核心功能亮点

  • 产品重塑:借助 /office-hours 命令,通过一系列精炼的提问,深入剖析产品设想,挑战固有观念,并生成切实可行的实现路径。
  • 规划审视/plan-ceo-review 命令从高层视角审视项目需求;/plan-eng-review 则专注于架构和测试矩阵的完善;而 /plan-design-review 则会进行评分并识别潜在的 AI 生成内容质量问题。
  • 设计体系构建/design-consultation 命令能够从零开始构建一套完整的设计体系,并生成逼真的原型图及 DESIGN.md 文档。
  • 代码审计与修复/review 命令能够精准定位生产环境中的潜在风险并尝试自动修复;/investigate 则进行系统性的根因分析,并在三次尝试失败后中断。
  • 设计缺陷修正/design-review 命令在完成审计后,将直接着手修复问题,以原子化的提交方式进行,并生成直观的前后对比截图。
  • 质量保障流程/qa 命令执行真实的浏览器测试,自动修复发现的 bug,并生成回归测试用例;/qa-only 则仅生成测试报告,不修改代码。
  • 安全合规审查/cso 命令执行 OWASP Top 10 安全标准和 STRIDE 威胁建模,并提供具体的攻击场景分析。
  • 发布与部署自动化/ship 命令实现代码同步、测试、Pull Request 开启的一站式操作;/land-and-deploy 则在代码合并后自动部署并验证生产环境健康;/canary 用于监控发布后的错误和性能表现。
  • 浏览器自动化能力/browse 命令能够操控真实的 Chromium 浏览器进行点击、截图等操作;/setup-browser-cookies 则支持导入真实浏览器 cookie。
  • 双 AI 交叉验证机制/codex 命令引入 OpenAI Codex 进行的审查,与 Claude 形成互补,发现潜在的盲点。
  • 团队绩效复盘/retro 命令生成周度工程报告,涵盖个人数据、发布连续性和测试趋势等关键指标。
  • 安全防护指令/careful 在执行可能具有破坏性的命令前发出警告;/freeze 用于锁定编辑范围;/guard 则整合了前两者的功能,提供全面的安全保障。
  • 效率提升工具/autoplan 命令能够一键串联 CEO、设计和工程审查流程;/document-release 自动同步文档与代码变更;/gstack-upgrade 实现工具自身的更新迭代。

gstack 的关键信息与使用前提

  • 开发者:Garry Tan,Y Combinator 的总裁兼 CEO。
  • 核心价值:将 Claude Code 升级为具备多重专业角色的虚拟工程团队。
  • 量化成果:在 60 天内处理了 60 万行代码,日均产出 1-2 万行,同时并行管理 10-15 个 Sprint。
  • 组成部分:包含 15 个专业角色和 6 个增强工具,所有操作均通过斜杠命令触发。
  • 必备软件:Claude Code、Git、Bun v1.0 及以上版本。
  • Windows 用户特别提示:需要安装 Node.js,因为 Bun 在 Windows 上可能存在 Playwright 兼容性问题,届时会自动回退至 Node.js。
  • 安装便捷性:安装过程仅需约 30 秒。
  • 配置要求:需要在项目 CLAUDE.md 文件中添加 gstack 的技能列表。
  • 浏览器支持:可选 Chrome、Arc、Brave 或 Edge 浏览器用于 cookie 导入。

gstack 的卓越优势所在

  • 流程结构化:能够将零散的 AI 指令转化为完整的 Sprint 流程,涵盖思考、规划、构建、审查、测试和发布等环节,有效避免输出的混乱。
  • 角色专业分工:15 个专家角色各司其职,如同真实团队般协作:CEO 负责方向把握,Staff 工程师专注于 bug 修复,QA 负责人则使用真实浏览器进行流程测试。
  • 强大的并行处理能力:支持同时运行 10-15 个的 Sprint,其管理模式如同 CEO 管理团队,关键决策介入,其余流程自动推进。
  • 真实的浏览器交互/browse 命令能操控真实的 Chromium 浏览器,实现用户在界面上的真实点击、截图操作,甚至处理验证码,让 AI 真正“看见”并理解界面。
  • 双 AI 交叉验证机制/codex 命令引入 OpenAI Codex 进行审查,与 Claude 进行交叉比对,从而发现潜在的盲点,显著提升代码质量。
  • 自动化修复闭环/qa 命令在发现 bug 后,能够自动修复、生成回归测试并重新验证,实现无需人工干预的完整修复流程。

如何高效利用 gstack

  • 环境部署:在 Claude Code 中执行安装命令,系统将自动克隆仓库、编译二进制文件并将所有技能注册到本地。
  • 项目适配:若需团队共享,将 gstack 复制到项目内的 .claude/skills/ 目录,并重新运行 setup。随后,在 CLAUDE.md 文件中添加技能列表,以便 Claude 识别。
  • 产品启动(/office-hours):描述您的产品设想,AI 将挑战您的表述框架、质疑前提假设、挖掘隐藏需求,并生成设计文档,自动传递给后续的处理流程。
  • 规划审查(/plan-ceo-review 等):依次执行 CEO 审查以确定方向,工程审查以锁定架构,设计审查以评估可行性,通过三层把关确保方案无误后再进入开发阶段。
  • 代码实现(自动或手动):在规划获批后,AI 将根据设计文档自动编写代码,或者您也可以手动开发,完成后再进入审查环节。
  • 质量检验(/review + /qa):运行 /review 命令查找生产环境中的潜在问题并尝试自动修复,接着运行 /qa 命令,利用真实浏览器进行点击测试,发现 bug 后自动修复并生成回归测试。
  • 发布上线(/ship):执行 /ship 命令,实现主分支代码同步、测试运行、覆盖率审计、代码推送以及 Pull Request 的自动开启,完成整个发布流程。
  • 持续迭代(/retro + /gstack-upgrade):定期运行 /retro 命令进行团队数据复盘,并运行 /gstack-upgrade 命令实现工具自身的更新,获取最新功能。

gstack 的项目源码地址

  • GitHub 仓库:https://github.com/garrytan/gstack

gstack 与同类竞品之比较

维度gstackOpenAI CodexDevin (Cognition)
定位Claude Code 的虚拟工程团队工作流OpenAI 官方 CLI 代码助手全自主 AI 软件工程师
核心形态15个专家角色 + 6个工具,斜杠命令调用单一会话式命令行工具云端 Agent,端到端开发
工作流结构化 Sprint(思考→规划→构建→审查→测试→发布)对话,无固定流程自主规划执行,人工介入少
并行能力支持 10-15 个 Sprint 同时运行单会话单任务
代码审查/review + /codex 双 AI 交叉验证自身审查自主测试验证
浏览器测试/browse 真实 Chromium 自动化内置浏览器自动化
团队协作通过 .claude/skills/ 共享配置个人使用企业级,按席位付费

gstack 的理想应用场景

  • 技术创业者:在身兼 CEO 和开发者双重角色的情况下,利用其结构化的流程,实现一人抵多人,大幅提升开发效率。
  • Claude Code 新用户:为初次接触 Claude Code 的用户提供清晰的专家角色和预设工作流,帮助他们快速上手,避免面对空白提示词的迷茫。
  • 技术领导者和资深工程师:对于需要实施严格代码审查、QA 和自动化发布流程的团队,gstack 确保每个 Pull Request 都经过多重严格把关。
  • 多项目并行开发需求:在需要同时推进 10-15 个 Sprint 的情况下,gstack 的标准化流程能够有效管理多个 AI 会话,避免陷入混乱。
  • 注重代码质量的团队:致力于提升生产环境安全性的团队,可以通过双 AI 交叉审查、真实浏览器测试和自动化回归测试等机制,获得更可靠的代码质量保障。
阅读原文
© 版权声明
蝉镜AI数字人

相关文章

蝉镜AI数字人

暂无评论

暂无评论...