标签:语音合成
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
DeepL Voice:DeepL推出全新实时语音翻译功能
DeepL Voice是DeepL推出的即时语音翻译服务,帮助全球团队打破语言障碍,实现无缝沟通。DeepL Voice包括两个产品:DeepL Voice for Meetings和DeepL Voice fo...
OpenVoice – 免费开源的AI语音克隆项目
OpenVoice是由MyShell推出的一个免费开源的AI即时语音克隆项目,相较于其他的语音克隆技术,OpenVoice的优势在于仅需一段简短的音频,便能以惊人的准确度复刻...
GPT-SoVITS – 开源的声音克隆项目,只需少量数据即可合成声音
GPT-SoVITS是一个开源的声音克隆项目,该语音合成工具结合了GPT模型和SoVITS变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换。该工...
MeloTTS – MyShell AI推出的多语言文本到语音转换工具
MeloTTS 是一个由 MyShell AI 开发的开源的高质量多语言文本转语音(TTS)库,能够将文本转换成自然流畅的语音输出,支持多种语言。MeloTTS 的语音合成速度非...
VoiceCraft – 开源的语音编辑和文本转语音模型
VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言模型,专注于零样本语音编辑和文本到语音(TTS)任务。该模型采用Transformer架构...
Voice Engine – OpenAI推出的AI语音合成和声音克隆模型
Voice Engine是OpenAI最新推出的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本输入,生成接近原声的自然听起来的语音。该项技术自2022年...
Parler-TTS – Hugging Face开源的文本转语音模型
Parler-TTS是由Hugging Face推出的一款开源的文本到语音(TTS)模型,能够通过输入提示描述模仿特定说话者的风格(性别、音调、说话风格等),生成高质量、听...
ChatTTS – 开源的用于对话的生成式语音合成模型
ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万小时的中英文数据进行训练,能够生成高质量、自然流畅的对话语音。
Seed-TTS – 字节跳动推出的文本到语音生成模型
Seed-TTS是由字节跳动开发的一系列高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能力和自然度。
Toucan TTS – 免费开源的文本转语音工具,支持超7000种语言
Toucan TTS是由德国斯图加特大学自然语言处理研究所(IMS)开发的文本到语音合成工具箱,支持超过7000种语言,包括多种方言和变体,提供多说话人语音合成、语...
ElevenLabs Reader App – AI文本转语音应用
ElevenLabs Reader App是由AI语音初创公司ElevenLabs推出的一款文本转语音应用,利用AI技术将各类文本内容,如文章、PDF文件、ePub等,转化为自然流畅、高音...
Fish Speech – 开源的高效文本到语音合成TTS工具
Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近人类水平的语音合成...
Qwen2-Audio – 阿里通义千问团队推出的开源AI语音模型
Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、音频分析功能,支持超过8种语言。Qwen2-Audio在...
Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型
Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge...
GLM-4V-Plus – 智谱AI最新推出的多模态AI模型,专注图像和视频理解
GLM-4V-Plus是智谱AI最新推出的多模态AI模型,专注于图像和视频理解。GLM-4V-Plus不仅能够精确分析静态图像,还具备动态视频内容的时间感知和理解能力,能捕...
12