标签：音频处理

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

剪小映

剪小映是抖音推出的AI视频剪辑应用，专为零基础用户设计，操作简单便捷。具备AI智能解析功能，可精准识别素材中的场景、人物等元素，为用户提供智能剪辑指引...

阅读原文

AI工具

1年前 (2025)

Aero-1-Audio

Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型，基于 Qwen-2.5-1.5B 构建，仅包含 1.5 亿参数。专为长音频处理设计，能支持长达 15 分钟的连续音频输入，无...

阅读原文

AI工具

1年前 (2025)

AudioX

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型，专门用于从任意内容生成音频和音乐。模型能处理多种输入模态，包括文本、视频、图像、音乐和...

阅读原文

AI工具

1年前 (2025)

MiniMax Audio

MiniMax Audio是MiniMax推出的AI语音合成工具，能创建逼真的多语言、多声音和多情感的语音。支持文本转语音（TTS），能将文本快速转换为自然流畅的语音。用户...

阅读原文

AI工具

1年前 (2025)

DiffRhythm

DiffRhythm 是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包含人声和伴奏的完整...

阅读原文

AI工具

1年前 (2025)

海螺视频APP

海螺视频APP是MiniMax推出的AI视频生成工具，基于AI技术帮助用户生成高质量视频内容。海螺视频APP支持文生视频（T2V）和图生视频（I2V）功能，用户输入文本或...

阅读原文

AI工具

1年前 (2025)

PaliGemma 2 mix

PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型（VLM）。集成了多种视觉和语言处理能力，支持图像描述、目标检测、图像分割、OCR以及文档理解等...

阅读原文

AI工具

1年前 (2025)

OmniAudio-2.6B

OmniAudio-2.6B是Nexa AI推出的音频语言模型，专为边缘部署设计，能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...

阅读原文

AI工具

2年前 (2024)

MMAudio：高质量AI音频合成的多模态联合训练技术创新

MMAudio是先进视频到音频合成技术，基于多模态联合训练，让模型能在广泛的视听和音频文本数据集上进行训练。技术的核心是同步模块，确保生成的音频与视频帧精...

阅读原文

AI工具

2年前 (2024)

EchoMimicV2：革新数字人生成技术实现个性化虚拟形象定制

EchoMimicV2是蚂蚁集团推出的半身人体动画（数字人）生成方法，基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频，确保音频内容与半身动作的一致性。...

阅读原文

AI工具

2年前 (2024)

GPT-SoVITS

GPT-SoVITS是一个开源的声音克隆项目，该语音合成工具结合了GPT模型和SoVITS变声器技术，仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换。该工...

阅读原文

AI工具

2年前 (2024)

琴乐大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型，该模型通过输入中英文关键词、描述性语句或音频，能够直接生成立体声音频或...

阅读原文

AI工具

2年前 (2024)

Qwen2-Audio

Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型，支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能，支持超过8种语言。Qwen2-Audio在...

阅读原文

AI项目和框架

2年前 (2024)

MooER

MooER是摩尔线程推出的业界首个基于国产全功能GPU训练的开源音频理解大模型。不仅能进行中文和英文的语音识别，还具备中译英的语音翻译能力。

阅读原文

AI工具

2年前 (2024)

CapCut

CapCut是抖音推出的免费全能视频编辑器，支持多种剪辑功能，如视频剪辑、音频编辑、添加字幕、滤镜和转场效果。简单易学，适合初学者和专业人士。CapCut不仅...

阅读原文

AI工具

2年前 (2024)