语音合成 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

Voxtral TTS

Voxtral TTS 是 Mistral AI开源的文本转语音模型，基于 40 亿参数架构，支持 9 种语言。模型具备 90 毫秒超低延迟和 6 倍实时生成速度，仅需 3-5 秒音频可实...

阅读原文

AI工具

3个月前

Fun-AudioGen-VD

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型，定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle&quo...

阅读原文

AI工具

3个月前

Ming-omni-tts

Ming-omni-tts 是蚂蚁集团开源的统一音频生成模型，采用自回归架构实现语音、音乐和音效的联合生成。模型支持通过自然语言指令对语速、音调、音量、情感和方...

阅读原文

AI工具

4个月前

DiaMoE-TTS

DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成（TTS）框架。框架基于国际音标（IPA）统一输入体系，结合方言感知的 Mixture-of-Experts（MoE）架...

阅读原文

AI工具

8个月前

NeuTTS Air

NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS（文本到语音）模型。具备高拟真语音合成能力，声音自然流畅，几乎能以假乱真。支持本地运行，提供 ...

阅读原文

AI工具

8个月前

Qwen3-TTS-Flash

Qwen3-TTS-Flash 是阿里通义推出的支持多音色、多语言和多方言的旗舰语音合成模型。模型具备卓越的中英语音稳定性，出色的多语言性能，及高表现力的拟人音色。

阅读原文

AI工具

9个月前

IndexTTS2

IndexTTS2是B站语音团队开发的新型文本转语音（TTS）模型，已经正式开源。模型在情感表达和时长控制方面实现了重大突破，是首个支持精确时长控制的自回归TTS...

阅读原文

AI工具

9个月前

UnifiedTTS

UnifiedTTS 是提供一站式文本转语音（TTS）服务的平台。通过统一的 API 接口，整合了多种主流的 TTS 服务，包括 Microsoft Azure、MiniMax、阿里云和 ElevenL...

阅读原文

AI工具

9个月前

AudioGen-Omni

AudioGen-Omni是快手推出的多模态音频生成框架，框架能基于视频、文本等输入生成高质量的音频、语音和歌曲。框架通过统一的歌词-文本编码器和相位对齐各向异...

阅读原文

AI工具

10个月前

HuHu.ai

HuHu.ai 是专为时尚电商设计的 AI 平台，通过智能技术帮助品牌快速生成高质量的模特试穿图，优化内容创作流程，提升电商转化率。能将平铺图、衣架图或幽灵模...

阅读原文

AI工具

11个月前

Higgs Audio V2

Higgs Audio V2 是李沐及其团队 Boson AI 开发的开源语音大模型。基于超过1000万小时的音频数据训练而成，具备多语言对话生成、自动韵律调整、语音克隆和歌声...

阅读原文

AI工具

11个月前

Kyutai TTS

Kyutai TTS 是法国人工智能研究机构 Kyutai Labs 推出的流式文本转语音（TTS）技术。是创新的语音合成系统，能实时将文本转换为自然流畅的语音，无需等待完整...

阅读原文

AI工具

11个月前

Qwen-TTS

Qwen-TTS是阿里通义推出的语音合成模型，具备自然、稳定、快速的特点。模型能根据文本和音色参数输出高质量音频，支持中英文及方言合成，如北京话、上海话、...

阅读原文

AI工具

12个月前

智声云配

智声云配（DubbingX）是 AI 智能配音工具，提供语音合成（TTS）、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言，拥有近2500种情...

阅读原文

AI工具

12个月前

Speech-02

Speech-02 是 MiniMax 推出的新一代文本到语音（TTS）模型。模型基于回归 Transformer 架构，实现零样本语音克隆，仅需几秒参考语音能生成高度相似的目标语音...

阅读原文

AI工具

1年前 (2025)

标签：语音合成