一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,并且生成相关的任务列表的AI笔记工具。notesGPT官网入口网址
自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。MoneyPrinter官网入口网址
腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象,YOLO-World官网入口网址
一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。Audio2Face官网入口网址
一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。Media2Face官网入口网址
一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。WhisperFusion官网入口网址
一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。StreamRAG官网入口网址
一个专门为DuckDB数据库设计的文本到SQL的模型,你可以使用自然语言说描述你的需求,它会自动转换成SQL代码。DuckDB-NSQL官网入口网址
一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。Diffuse to Choose官网入口网址
基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。SupIR官网入口网址
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调,FunASR 基础语音识别工具包官网入口网址
谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。Lumiere官网入口网址
一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。,DDColor官网入口网址
网易有道一个开源的本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。,QAnything官网入口网址
字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。DiffusionGPT官网入口网址
一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。GPT-SoVITS官网入口网址
一个增强版免费开源的ChatGPT程序,LibreChat 是一个免费开源的聊天机器人平台,集成了多种 AI 模型。LibreChat官网入口网址
AI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。Motionshop官网入口网址
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。PhotoMaker官网入口网址
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。,EmotiVoice官网入口网址
一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型。(基于 LangChain 实现插件功能),ChatGPT-Next-Web-LangChain官网入口网址
一个面部图像精准恢复和个性编辑技术工具,不仅能复原受损图像细节,同时能精准捕捉和重现个人独特的面部特征。同时它还支持换脸。Personalized Restoration官网入口网址
专门用于生成 SQL 语句的模型,sqlcoder官网入口网址
自动为视频生成高亮字幕,AutoCaption官网入口网址
基于ChatGPT的微信机器人,chatgpt-on-wechat官网入口网址
LlamaIndex 推出聊天机器人应用,支持设置prompt、上传文件聊天、分享聊天,基本是一键部署。,chat-llamaindex官网入口网址
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。,VoiceStreamAI官网入口网址
一种用于构建人工智能代理的反应式运行时,Chidori官网入口网址
一个使用自然语言进行交流的应用程序,它是通过 OpenAI Functions 和 Vercel AI SDK 构建的,Chat with Hacker News官网入口网址
一个非常实用的PDF转HTML工具,可以帮助用户轻松地将PDF文件转换为可在网页浏览器中查看的格式。,pdf2htmlEX官网入口网址
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。,macOSpilot官网入口网址
一个轻量级的 JavaScript(没有依赖项),为 SVG 设置动画,使它们看起来像是被绘制的,Vivus官网入口网址