标签:音频处理

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

GPT-SoVITS – 开源的声音克隆项目,只需少量数据即可合成声音

GPT-SoVITS是一个开源的声音克隆项目,该语音合成工具结合了GPT模型和SoVITS变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换。该工...
阅读原文

琴乐大模型 – 腾讯推出的AI音乐创作大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型,该模型通过输入中英文关键词、描述性语句或音频,能够直接生成立体声音频或...
阅读原文

Qwen2-Audio – 阿里通义千问团队推出的开源AI语音模型

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能,支持超过8种语言。Qwen2-Audio在...
阅读原文

MooER – 摩尔线程推出的业界首个音频理解大模型

MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别,还具备中译英的语音翻译能力。
阅读原文

CapCut – 抖音推出的免费全能视频编辑器

CapCut是抖音推出的免费全能视频编辑器,支持多种剪辑功能,如视频剪辑、音频编辑、添加字幕、滤镜和转场效果。简单易学,适合初学者和专业人士。CapCut不仅...
阅读原文

Chillin – AI在线视频编辑工具,无缝结合AE和Pr的核心功能

Chillin是AI驱动的在线视频编辑器,融合了After Effects和Premiere Pro的功能,提供无缝的非线性视频编辑和矢量动画制作。支持Lottie和Svg格式,具备AI字幕生...
阅读原文

Faster Whisper – 一款高效语音识别工具,实现高速转写和快速推理

Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具,运用CTranslate2引擎实现快速推理。在保持高准确度的同时,提升语音转写速度,降低内存使...
阅读原文

NeMo – 英伟达推出的用于构建、定制和部署生成式AI模型

NeMo 是由 NVIDIA 提供的端到端云原生框架,用于构建、定制和部署生成式 AI 模型。支持大型语言模型(LLMs)、多模态模型、语音识别和文本转语音(TTS)等应...
阅读原文

Gradio – 开源的Python库,快速创建机器学习模型的交互式网页

Gradio 是一个开源的 Python 库,简化机器学习模型的演示和共享过程。支持开发者基于简单的代码快速创建出友好的网页界面,任何人、任何地点能轻松使用机器学...
阅读原文

KAPWING – 在线AI视频编辑平台,提供多种必备剪辑功能

KAPWING是一个集成AI技术的在线视频编辑平台,基于AI工具简化视频创作流程,用户能快速生成和编辑视频内容。平台提供包括AI视频生成器、文档转视频、文本转语...
阅读原文

易我人声分离 – AI音频编辑工具,智能分离人声和背景音乐

易我人声分离是成都易我科技推出的AI驱动的音频编辑工具,智能地将音频或视频中的人声和背景音乐分离。基于深度学习技术,软件为用户提供一键操作的便捷体验...
阅读原文

Auphonic – AI音频剪辑工具,自动完成音频处理任务生成高质量音频

Auphonic是AI在线音频后期处理工具,基于AI能算法帮助用户提升音频质量。无需专业知识,用户能自动完成音量平衡、降噪、混响减少、滤波、自动剪切静音和填充...
阅读原文

CogSound – 智谱AI最新推出的音效模型

CogSound是智谱AI最新推出的音效模型,能为无声视频增添动人的音效。 基于GLM-4V的视频理解能力,CogSound能精准识别理解视频背后的语义和情感,为无声视频添...
阅读原文

AudioJam – AI音乐软件,支持在任意歌曲中分离不同音轨

AudioJam是为音乐爱好者和专业人士设计的AI音乐软件,集成和弦音调分析、乐器伴奏分离、AB循环、降速播放等多种功能。基于Spleeter AI技术,从任意歌曲中分离...
阅读原文