Indic Parler-TTS

AI工具1年前 (2025)更新 AI工具集

Indic Parler-TTS – 开源多语言TTS模型，专注于合成印度语和英语

Indic Parler-TTS 是一个强大的多语言文本转语音（TTS）模型，由 Hugging Face 和 AI4Bharat 团队联合开发，专为印度语言和英语的语音合成而设计。作为 Parler-TTS Mini 的扩展版本，Indic Parler-TTS 支持 20 种印度语言及英语，提供 69 种独特的语音选项，能够生成自然、清晰且富有情感的语音输出。

Indic Parler-TTS是什么

Indic Parler-TTS 是一个先进的多语言文本转语音（TTS）模型，由 Hugging Face 和 AI4Bharat 团队合作推出。该模型专注于印度语言和英语的语音合成，作为 Parler-TTS Mini 的扩展，支持 20 种印度语言及英语，拥有 69 种独特的语音选择。Indic Parler-TTS 通过描述性文本输入，能够灵活调整语音的音调、语速、情感及背景噪音等特性，适用于多种应用场景。该模型在多种印度语言上表现卓越，尤其在低资源语言方面展现出强大的适应能力。

Indic Parler-TTS

Indic Parler-TTS的主要功能

多语言能力：
- 支持 20 种印度语言及英语，包括印地语、语、孟加拉语、泰卢固语、马拉地语等多种语言。
- 为某些未正式支持的语言如克什米尔语和旁遮普语提供有限支持。
丰富的情感和语音特征：
- 支持多种情感表达，如愤怒、快乐、悲伤和惊讶等。
- 可调节语音的音调、语速、背景噪声、混响和整体音质。
灵活的输入方式：
- 用户通过描述性文本（caption）控制语音特性，例如指定说话者的性别、口音、情感及录音环境。
- 模型能够自动识别输入文本的语言，实时切换到相应语言进行语音合成。
高质量的语音输出：在多种语言上表现卓越，尤其在印度语言中尤为出色。
语音多样性：提供 69 种独特的语音，每种语言都有推荐的语音，确保自然和清晰的发音。
定制化能力：用户可以基于描述性文本精确控制语音的背景噪声、混响、情感表现、音调、语速和音质。