AI工具

Zonos-v0.1

Zonos-v0.1是Zyphra推出的高保真文本到语音(TTS)模型。Zonos-v0.1包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zono...
阅读原文

InspireMusic

InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简单的文字描述或音频提示...
阅读原文

TurboTTS

TurboTTS 是免费的在线文本转语音工具,支持70多种语言和300多种真实语音选择,能生成自然、逼真的语音效果,适用于短视频创作、在线教育、广告制作、播客等...
阅读原文

Omniflow

Omniflow 是专注于帮助用户将创意快速转化为产品的AI工具。通过 AI 技术简化产品开发流程,提供从创意到发布的全流程支持。Omniflow 的核心功能包括 IdeaFlow...
阅读原文

Goku

Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架,支持文生视频、图生视频...
阅读原文

covers.ai

covers.ai是基于AI技术的音乐创作平台,提供 AI 语音生成和 AI 歌曲生成工具。covers.ai基于先进的AI技术,支持用户创建个性化的AI语音模型,或用现有的名人...
阅读原文

Satori

Satori 是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型,专注于提升推理能力。基于Qwen-2.5-Math-7B,Satori通过小规模的格式微调和大规模的增强...
阅读原文

ACE++

ACE++是阿里巴巴通义实验室推出的先进的图像生成与编辑工具,通过指令化和上下文感知的内容填充技术,实现了高质量的图像创作和编辑功能。
阅读原文

Ranger

Ranger是AI测试平台,基于人工智能技术为企业提供自动化软件测试解决方案。用户可通过简单英语描述测试需求,Ranger能自动生成测试用例,利用其智能导航技术...
阅读原文

Music Muse

Music Muse 是AI音乐创作平台。基于先进的AI技术,帮助用户快速生成各种风格的音乐作品。 用户可以通过简单的描述(如音乐风格、情绪、节奏等)来指导AI创作...
阅读原文

RapiLearn AI

RapiLearn AI 是华清科技推出的 AI 教育工具,旨在打造个性化、互动式学习体验。用户上传多种格式学习资料,系统能整合生成视频、音频、笔记、测试、思维导图...
阅读原文

LLaVA-Rad

LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部X光(CXR)成像。基于LLaVA-Med的基础架构和训练...
阅读原文

MotionCanvas

MotionCanvas是香港中文大学、Adobe 研究院和莫纳什大学推出的图像到视频(I2V)生成方法,能将静态图像转化为具有丰富动态效果的视频。MotionCanvas基于引入...
阅读原文

MedRAX

MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理AI代理。通过整合最先进的胸部X光分析工具和多模态大型语言模型,形成一...
阅读原文

Scam AI

Scam AI 是基于人工智能的防诈骗平台,帮助用户快速验证视频、音频和文本内容的真实性,识别潜在的诈骗行为。通过自然语言处理(NLP)、视觉和音频认证技术,...
阅读原文