高性能、多人协作代码编辑器
开源项目,为开源社区提供服务
开源的协作写作Web应用
业界领先的开源大型混合专家模型
AI模型部署和推理优化的专家
开源替代品,基于搜索结果生成AI报告
文本到视频生成的开源模型,性能卓越。
文本到视频生成领域的先进模型架构
AI时代的视频编辑工具
高效视频生成建模的金字塔流匹配技术
开源视频生成模型
Genmo 的视频生成模型,具有高保真运动和强提示遵循性。
Mochi视频生成器的ComfyUI包装节点
基于 Apple MLX 框架的视频字幕生成工具
实时AI视频生成开源模型
为LTX视频模型提供额外控制的ComfyUI节点集合
视频处理界面,提供视频编码和解码功能
开放高效的视频水印技术
AI数字人口型同步技术,无限多开贴牌OEM解决方案
一站式AI数字人系统,支持视频合成、声音合成、声音克隆。
领先的文本到语音转换模型
大规模多语种语音生成数据集
300行代码实现基于LLM的语音转录。
与任何大型语言模型进行快速的免提语音交互。
与大型语言模型进行自然的语音对话
个性化AI助手,记录每一刻,与AI对话获取反馈。
极速语音识别,精准时间戳
开源的语音识别和说话人分割模型推理代码
一款文本转语音工具,帮助您轻松阅读文本。
Android平台上的私有、设备端语音识别键盘和文字服务
统一的开放命名实体和语音识别模型
开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。