Pixelle-Video官网
AIDC-AI开源的一个 ComfyUI 短视频生成工具。你只需要给一个主题,它就能自动完成写脚本、生成画面、合成配音和视频,基本上不用自己动手剪辑。
网站提供:Ai工具箱,Ai开源项目,Pixelle,Video。

Pixelle-Video简介
🚀 AI 全自动短视频引擎 | AI Fully Automated Short Video Engine – AIDC-AI/Pixelle-Video
Pixelle-Video 是什么
Pixelle-Video是aiDC-AI 开源的一个 ComfyUI 短视频生成工具。你只需要给一个主题,它就能自动完成写脚本、生成画面、合成配音和视频,基本上不用自己动手剪辑。它兼容 GPT、通义千问、DeepSeek 等多种模型,也支持声音克隆和数字人口播,适合自媒体运营者和刚接触 AI 视频的人。

Pixelle-Video官网截图
功能特征
全自动生成闭环:输入主题后,系统自动调用大语言模型生成解说脚本,为每句文案配上 AI 图片或动态视频,合成配音和背景音乐,最后输出完整视频。
多模型 LLM 支持:脚本引擎可以用 GPT、通义千问、DeepSeek、Ollama 等后端,用户可以根据成本、响应速度或内容风格切换,本地部署时不用调用外部 API。
AI 视觉生成:支持 FLUX、WAN 2.1 / 2.2 等模型生成图片和动态视频,也可以上传自己的图片或视频素材,由 AI 分析后自动生成配套脚本。
智能语音与克隆:集成了 Edge-TTS、Index-TTS 等主流语音方案,支持声音克隆(上传 MP3/WAV/FLAC 参考音频),还新增了多语言 TTS 和数字人口播功能。
灵活模板与尺寸:提供静态、图片、视频三类 HTML 模板,支持竖屏、横屏、方形等多种画幅,也可以自定义模板。
原子能力组合:基于 ComfyUI 工作流,可以随意替换生图模型、TTS 引擎或视频生成模型,满足个性化需求。
动作迁移模块(2026年1月更新):可以把参考视频中的动作模式迁移到 AI 生成的内容上,让画面动态更自然。
应用场景
社交媒体批量运营:适合 TikTok、小红书、Instagram Reels 等平台的知识分享、产品推广和评测类短视频快速批量生产。
个人创作者试水:没有技术背景的初学者可以用 Windows 一键整合包零配置上手,降低 AI 视频创作的门槛。
素材再创作:上传现有的照片或视频,由 AI 自动分析内容并生成解说和配音,实现从素材到成片的一键转换。
多语言内容出海:借助多语言 TTS 和数字人口播,快速生成面向不同地区市场的本地化视频。
使用方法
安装部署
Windows 用户:从 GitHub Releases 下载一键整合包,解压后双击 start.bat 启动 Web 界面。
macOS / Linux 用户:安装 uv 和 ffmpeg,克隆仓库后执行 uv run streamlit run web/app.py。
首次配置
浏览器打开 http://localhost:8501,展开「⚙️ 系统配置」。配置 LLM(选择模型并填入 API Key)和图像生成(ComfyUI 本地地址或 RunningHub API Key),点击保存。
生成视频
内容输入:左侧栏选择「AI 生成内容」输入主题,或选择「固定文案内容」粘贴已有脚本;可以选用内置或自定义 BGM。
语音设置:中间栏选择 TTS 工作流(Edge-TTS / Index-TTS 等),可上传参考音频进行声音克隆,并预览效果。
视觉设置:选择 ComfyUI 图像/视频工作流,设置尺寸和提示词前缀(英文),挑选视频模板并预览。
合成输出:点击「🎬 生成视频」,实时查看进度(脚本 → 配图 → 语音 → 视频),完成后自动播放并保存到 output/ 文件夹。
常见问题
Q:首次使用需要多久?
A:取决于分镜数量、网络环境和 AI 推理速度,通常在几分钟内完成。
Q:对结果不满意怎么调整?
A:可以换 LLM 模型调整脚本风格;修改图像尺寸和 Prompt Prefix 改变画风;切换 TTS 工作流或参考音频来调整配音;尝试不同模板和画幅。
Q:Pixelle-Video使用成本是多少?
A:项目支持完全免费方案——LLM 用 Ollama(本地)+ ComfyUI 本地部署 = 零成本;推荐方案是通义千问(极低 API 费用)+ 本地 ComfyUI;如果用 OpenAI 加 RunningHub 云端方案成本会高一些。
Q:支持自定义模板吗?
A:支持。熟悉 HTML 的用户可以在 templates/ 文件夹里创建自己的模板;懂 ComfyUI 的用户可以在 workflows/ 文件夹里自定义图像或 TTS 工作流。
产品点评
Pixelle-Video 不是传统的剪辑软件,而是一条端到端的 AIGC 自动化流水线。它最大的价值在于把 LLM、计算机视觉和语音合成整合成一套标准工作流,同时借助 ComfyUI 的模块化设计保持了很高的扩展性。对于需要每天产出多条内容的自媒体运营者来说,它明显缩短了从选题到成片的周期。不过如果追求电影级的画质或复杂的叙事逻辑,它自动化生成的模板痕迹还是比较明显,不够用。
优点:
开源免费(Apache-2.0),可以完全本地化零成本运行(Ollama + 本地 ComfyUI)
Windows 一键整合包开箱即用,不需要配置 Python 环境
工作流高度模块化,ComfyUI 生态里的模型和插件可以直接复用
支持声音克隆和数字人,满足个性化和品牌化需求
缺点:
本地运行对硬件有要求,建议配一块 6GB 以上显存的 NVIDIA 显卡
生成质量受限于各个 AI 模型本身的能力,复杂脚本下还是可能图文不匹配
目前更适合结构简单的短视频,长视频或复杂的支持有限
Pixelle-Video官网入口网址
https://github.com/AIDC-AI/Pixelle-Video
OpenI小编发现Pixelle-Video网站非常受用户欢迎,请访问Pixelle-Video网址入口试用。
数据评估
本站OpenI提供的Pixelle-Video都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由OpenI实际控制,在2026年 4月 29日 下午6:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,OpenI不承担任何责任。




粤公网安备 44011502001135号