一个帮助你在本地运行开源大模型的程序,支持Windows、Mac和Linux多平台,Jan官网入口网址
轻松构建LLMs应用程序开源UI可视化工具,FlowiseAI官网入口网址
一个使用GPT模型来控制浏览器的工具。它通过接受自然语言命令,实现了用人类方式与浏览器进行交互的功能。,BrowserGPT官网入口网址
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点,Fooocus官网入口网址
一种专门为实时图像生成服务设计的扩散模型管道,显著地提升了实时图像生成的性能。,StreamDiffusion官网入口网址
微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。,DragNUWA官网入口网址
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本,Background Removal官网入口网址
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。,LCM(Latent Consistency Models)官网入口网址
一个功能强大且易于使用的视...
一款专业的人物肖像提示词生成工具,ComfyUI Portrait Master官网入口网址
通过将静态内容与时间变形结合,为视频处理提供了新的视角和工具,CoDeF官网入口网址
高级语音和Deepfake神经网络工具,Wunjo官网入口网址
一个简洁、易于使用的控制台记录器,具有多彩的日志输出、时间戳和性能统计、自定义日志级别和输出位置以及错误追踪和堆栈跟踪等功能。,Consola官网入口网址
音频转文字,Bark官网入口网址
可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用。,gpt-crawler官网入口网址
一个功能强大的数据库工具,...
一种分层自适应零样本语音风格转换模型,HierVST官网入口网址
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务,PaddleMIX官网入口网址
全文本搜索引擎库,Tantivy官网入口网址
一个用于音频处理和生成的深度学习库,Audiocraft官网入口网址
一个将稳定扩散模型引入Web浏览器的项目,web-stable-diffusion官网入口网址
将屏幕截图转换为清洁的HTML / Tailwind / JS代码,screenshot-to-code官网入口网址
网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。QAnything AI官网入口网址
ChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。Jan.ai官网入口网址
基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。ChatGPT-Plus官网入口网址
文生3D数字人工具,借助 Make-A-Character,您可以毫不费力地从文本描述中生成可控、逼真、可动画的3D数字人角色。Make-A-Character官网入口网址
从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。Audio2Photoreal官网入口网址
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。Zero123官网入口网址
该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。IP-Adapter-FaceID官网入口网址
一个AI自动投递简历的工具,结合chatgpt与rpa技术,实现一键自动寻找工作、根据自己的简历和工作描述生成求职信、发送给hr的全流程自动操作。赛博投简历官网入口网址
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。VideoDrafter官网入口网址
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。DreamTalk官网入口网址