小型高效的视觉语言模型,让资源有限的研究者和开发者也能轻松使用先进的视觉语言功能。
自监督学习模型通过预测视频帧特征学习视觉表示,兼顾视频和图像任务,应用广泛。
低延迟、高准确、稳定性强的先进语音合成,带来高质量语音体验。
突破性AI工具,单步生成技术,高效高质量地生成视频和图像。
由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。FUZZ官网入口网址
一款开源代码智能体Agent,Codename Goose不仅能自动生成代码,还能安装、执行、测试。CodeName Goose官网入口网址
一个高度集成的、开源的大屏设计与数据可视化工具,基于SpringBoot、MyBatisPlus、Vue、ElementUI、G2Plot和Echarts等技术栈构建。DataRoom官网入口网址
AI神器大全 | AI工具集合导航站
长亭科技是国内顶尖的网络信息安全公司之一,专注为企业级用户提供高质量的应用安全防护解决方案。全球范围内首发基于智能语义分析的雷池(SafeLine)下一代 Web 应用防火墙,为企业用户带来更简单、更智能、更省心的安全产品及服务。
数学图形可视化引擎
一个由计算所、美团、腾讯等机构合作研发,专为电商场景设计,能够自动生成具有主播风格的AI虚拟主播带货视频神器。AnchorCrafter官网入口网址
LTX Video的简称,是由Lightricks推出的开源AI生成视频模型,LTX-Video 是第一个基于 DiT 的视频生成模型,可以实时生成具有逼真和多样化内容的高分辨率视频。LTX Video官网入口网址
BRIA AI开发的开源图像背景移除模型,RMBG-2.0基于创新的BiRefNet架构,能够在复杂环境和高细节图像中提供高精度的背景去除。RMBG-2.0官网入口网址
一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。PDFMathTranslate官网入口网址
一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案,ChatNio官网入口网址
一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。FacePoke官网入口网址
上海交通大学牛力教授团队推出的一款图像合成工具箱,经过六年的研发,集成了多种强大的图像处理功能。libcom官网入口网址
一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。ChatTTS-Forge官网入口网址
一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。EZ-Work官网入口网址
您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。LinkedIn_AIHawk官网入口网址
由快手可图团队开发的AI试衣技术,通过可图AI试衣,用户上传自已的照片,就可以在几秒钟内看到自己穿上不同衣服的效果。Kolors Virtual Try-On官网入口网址
一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。YouDub-Webui官网入口网址
一个开源的数据标注工具,可以帮助用户快速、准确、高效地对数据进行标注,从而提高机器学习模型的性能和质量。LabelU官网入口网址
一款能在视频中轻松任意插入手绘动画并与视频内容无缝融合的AI工具,通过VideoDoodles你可以在视频中添加手绘涂擦动画,这些动画不仅能跟随视频中的物体移动,还能自动调整大小和角度。VideoDoodles官网入口网址
一款开源的实时人脸交换和AI视频换脸工具。它能够利用单张图像对视频或其他图像进行人脸替换,适用于视频制作、动画创作等多种场景。Deep Live Cam官网入口网址
一款免费好用的视频解析下载工具,简单易学,无需抓包,不需要安装插件,支持流媒体下载 、视频下载 、 m3u8下载 、B站视频下载。MedisGo官网入口网址
阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。Emote Portrait Alive官网入口网址
一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电子表格的界面来创建复杂的企业级数据库应用程序,无需编写代码。Teable官网入口网址
一个开源混合AI搜索引擎,借助 MemFree,您可以立即从互联网、书签、笔记和文档中获得准确的答案。MemFree官网入口网址
一个开源的数据标注平台,致力于优化对于大型语言模型(LLM)开发不可或缺的数据标注过程。LabelLLM官网入口网址
一种深度融合文本理解和语音生成的一项新型语音合成技术,CosyVoice能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。CosyVoice官网入口网址
百度公司推出的视频生成模型,能够以文本和图像的任意组合作为输入条件进行视频生成。UniVG官网入口网址