一个公共的代码存储库,主要用于BIliBili视频网站、抖音以及人工智能(AI)方面的虚拟主播项目,GPT-vup官网入口网址
一款适用于搭建内部培训平台的开源系统,旨在为企业/机构打造自己品牌的内部培训平台,PlayEdu官网入口网址
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。,Coqui-TTS官网入口网址
文本来生成具有艺术风格的Cinemagraph动态图片,Text2Cinemagraph官网入口网址
一个开源的深度伪造工具包,用于生成逼真的深度伪造视频和图像。,dot官网入口网址
一个收集免费API的共享列表,包含各种各样的免费API,供开发者使用。这些API可以用于开发各种应用程序、网站和软件,为开发者提供了丰富的功能和数据源。,public-apis官网入口网址
主要用于数据分析领域,可以将用户需求转换为可执行代码,TaskWeaver官网入口网址
一个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。,clone-voice官网入口网址
快速、轻量级搜索引擎,sonic官网入口网址
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间,Open Interpreter官网入口网址
自动音乐生成研究的演示网站列表,文字生成音乐工具大全官网入口网址
一个帮助你在本地运行开源大模型的程序,支持Windows、Mac和Linux多平台,Jan官网入口网址
轻松构建LLMs应用程序开源UI可视化工具,FlowiseAI官网入口网址
一个使用GPT模型来控制浏览器的工具。它通过接受自然语言命令,实现了用人类方式与浏览器进行交互的功能。,BrowserGPT官网入口网址
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点,Fooocus官网入口网址
一种专门为实时图像生成服务设计的扩散模型管道,显著地提升了实时图像生成的性能。,StreamDiffusion官网入口网址
微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。,DragNUWA官网入口网址
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本,Background Removal官网入口网址
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。,LCM(Latent Consistency Models)官网入口网址
一个功能强大且易于使用的视频翻译和配音工具,适用于需要翻译视频或为视频添加不同语言配音的人们。,pyvideotrans官网入口网址
一款专业的人物肖像提示词生成工具,ComfyUI Portrait Master官网入口网址
通过将静态内容与时间变形结合,为视频处理提供了新的视角和工具,CoDeF官网入口网址
高级语音和Deepfake神经网络工具,Wunjo官网入口网址
一个简洁、易于使用的控制台记录器,具有多彩的日志输出、时间戳和性能统计、自定义日志级别和输出位置以及错误追踪和堆栈跟踪等功能。,Consola官网入口网址
音频转文字,Bark官网入口网址
可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用。,gpt-crawler官网入口网址
一个功能强大的数据库工具,它可以帮助用户子集化数据库、浏览关系数据,并提供数据库维护和管理功能。,Jailer官网入口网址
一种分层自适应零样本语音风格转换模型,HierVST官网入口网址
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务,PaddleMIX官网入口网址
全文本搜索引擎库,Tantivy官网入口网址
一个用于音频处理和生成的深度学习库,Audiocraft官网入口网址
一个将稳定扩散模型引入Web浏览器的项目,web-stable-diffusion官网入口网址