html-video – Open Design 团队开源的 HTML 版剪映
html-video:用代码驱动创意,打造世界级视频的革新者
在数字化浪潮汹涌的今天,视频内容已成为信息传播和品牌营销的核心载体。然而,传统的视频制作流程往往耗时耗力,对专业技能要求极高。现在,OpenDesign 团队(nexu.io)带来的开源项目 html-video,正以前所未有的方式颠覆这一现状。它将剪辑的魔力融入 HTML 的简洁,让 AI Agent 摇身一变成为视频创作大师,仅凭代码就能生成媲美专业水准的产品宣传、知识解读等各类视频。
html-video 的独特之处
html-video 并非简单的视频编辑工具,而是基于 hyperframes 框架构建的“HTML 版剪映”。它赋予 Agent(智能体)强大的能力,使其能够通过编写 HTML 代码来 orchestrate(编排)出令人惊叹的视频。该工具集成了超过 20 套精心设计的顶级模板,覆盖了从产品推广到深度知识讲解的广泛场景。更令人惊喜的是,它支持精细的分页编辑、灵活的多尺寸导出,并内置了 Minimax AI 的智能配音配乐功能,而且这一切无需任何 API Key,即可在本地环境中流畅运行。
核心功能亮点概览
- 模板化视频创作: 拥有 20 余套匠心独运的 HTML 视频风格模板,囊括产品推广、知识普及、数据可视化等多种应用场景。Agent 可随心调用,即刻生成动态 MP4 视频。
- 直观的分页编辑与即时预览: Studio 编辑器提供了直观的分页预览、编辑以及帧级别的文字调整功能。这意味着创作者无需反复导出查看效果,大大提升了修改的效率和流畅度。
- 全场景适配的多尺寸输出: 一键切换横屏 16:9、竖屏 9:16、方形 1:1,乃至小红书流行的 4:5 等主流视频规格,确保您的作品能在全平台无缝分发。
- Agent 的无缝集成: 能够自动识别并兼容本地的 6 种主流 Code Agent CLI(如 Codex、Claude Code、Hermes、Cursor Agent 等)。通过顶部的便捷切换,实现零配置的即插即用。
- AI 驱动的配音与配乐: 集成了 Minimax AI,能够根据视频内容智能生成旁白配音和背景音乐。其低 Token 消耗的特性,使得成本控制更加得心应手。
html-video 的使用流程解析
- 获取项目: 首先,将 html-video 开源项目从 GitHub 克隆至本地。
- 环境搭建: 运行安装命令,轻松配置本地环境,无需申请任何第三方 API Key。
- 启动 Studio: 打开本地的可视化编辑器,浏览并挑选您心仪的 20 多款内置模板。
- 内容输入: 将您的网站链接、文件或公众号文章等信息喂给 Agent,它将自动生成视频脚本。
- 精细打磨: 在 Studio 编辑器中,逐页预览、编辑文字和画面细节,实现实时调整,直至满意为止。
- 导出成品: 确认一切无误后,一键导出高清 MP4 视频,或直接生成带配音配乐的完整视频文件。
html-video 的核心竞争力
- 本地优先,成本为零: 完全在本地运行,摆脱对云端 API Key 的依赖,确保数据隐私安全,并极大降低了长期使用成本。
- Agent 原生设计: 专为 Code Agent 工作流量身打造,支持主流 CLI 工具一键切换,让 AI 驱动从内容到视频的全链路自动化成为可能。
- HTML 驱动,轻量高效: 以 HTML/CSS 取代传统视频工程,用约 3 万行代码实现了媲美剪映的体验,显著降低了技术门槛和维护成本。
- 实时迭代,所见即所得: 分页编辑模式支持逐帧修改和实时预览,彻底告别传统视频工具“修改-渲染-检查”的低效循环。
项目地址
- GitHub 仓库: https://github.com/nexu-io/html-video
与竞品对比分析
在视频生成工具领域,html-video 展现出其独特的优势。相较于 FireRed-OpenStoryline 这类具备导演思维的对话式 AI 视频剪辑 Agent,html-video 更侧重于“HTML 版剪映”的定位,强调 Agent 原生视频生成能力。其技术架构基于 hyperframes 和 HTML/CSS 渲染引擎,交互方式结合了 Studio 可视化编辑器与 Agent CLI 代码驱动,提供了更直接、更灵活的编辑体验。在素材来源上,html-video 依赖用户输入与内置模板,而 FireRed-OpenStoryline 则侧重在线素材搜索。html-video 的编辑粒度精细到帧级文字修改,而 FireRed-OpenStoryline 则通过对话式精修实现。AI 能力上,html-video 侧重模板化生成与 Minimax 配音配乐,FireRed-OpenStoryline 则涵盖脚本生成、ASR 粗剪、AI 等更广泛的 AI 剪辑功能。Agent 集成方面,html-video 原生支持多种 CLI 工具,FireRed-OpenStoryline 则需要配置 LLM API Key。最显著的优势在于,html-video 核心功能实现本地优先,零 API 成本,硬件要求低,普通笔记本即可运行,而 FireRed-OpenStoryline 虽可本地部署,但对 LLM API Key 有要求。html-video 凭借其 20+ 内置 HTML 视频模板,为用户提供了丰富的创作起点。
html-video 的应用场景拓展
- 知识内容批量生产: 将公众号文章、技术文档等转化为带有 AI 配音的知识解说视频,并轻松适配小红书 4:5、B站 16:9 等多种平台规格。
- 高效产品宣传视频: 输入产品官网链接,Agent 自动提炼卖点,生成动态产品展示视频,助力初创团队快速打造营销物料。
- 数据可视化报告: 将 CSV/JSON 数据转化为生动的数据图表视频,告别静态图表的枯燥,适用于汇报演示和社交媒体传播。
- 电商内容矩阵构建: 批量生成商品介绍、使用教程等短视频,结合 Minimax AI 配音,实现低成本、高效率的内容运营。


