标签:语音合成

edge-tts – 开源的AI文字转语音项目

edge-tts是开源的AI文字转语音项目,支持超过40种语言和300多种声音。edge-tts利用微软Azure Cognitive Services的强大功能,能将文本信息转换成流畅自然的语...
阅读原文

TikTok Voice – 免费的AI配音神器,提供丰富的音色选项

TikTok Voice 是基于AI技术的文字转语音(TTS)在线工具,将文本转换成各种流行于TikTok平台的声音效果。工具为用户提供多种语音选项,如女士声音、Siri声音...
阅读原文

AI解说大师 – AI影视剪辑工具,自动生成原创解说视频

AI解说大师是智能影视创作工具,基于先进的数字技术和AI大模型,让用户能够轻松生成原创解说视频。工具具备正版影视素材库、自动生成解说文案、音频和字幕智...

豆包AI视频模型 – 字节跳动推出的AI视频生成大模型:PixelDance和Seaweed

豆包AI视频模型是字节跳动推出的两款AI视频生成大模型:PixelDance 和 Seaweed 。PixelDance基于DiT结构,擅长理解复杂指令,生成连贯、多主体交互的视频片段...
阅读原文

PDF2Audio – 将PDF文档转换成音频博客的开源工具

PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的 GPT 模型生成播客脚本,通过文本到语音技术转化为音频。
阅读原文

F5-TTS – 上海交大推出开源的文本到语音(TTS)合成系统

F5-TTS是由上海交通大学开源的一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合扩散变换器(DiT)技术。系统在没有额外监督的情况下,...
阅读原文

语鲸 – AI阅读工具,基于深言科技的大模型能力

语鲸(LingoWhale)是基于深言科技大模型能力的一款AI阅读工具,通过智能总结、问答、思维导图等功能,帮助用户快速把握文章核心内容和结构。工具支持多端同...
阅读原文

Voice Design – ElevenLabs推出的AI语音生成工具

Voice Design是ElevenLabs推出的AI语音生成工具,用户只需描述所需声音的年龄、口音、性别、语调或音高,甚至是虚构角色如精灵、食人魔等,工具能快速生成独...
阅读原文

音鹿 – AI音频编辑软件,100+音色选择生成丰富的配音文件

音鹿是AI音频编辑软件,提供文字转语音、海量音色选择、AI翻唱、音频编辑工具等功能。用户能生成不同音色配音文件,上传音色为歌曲配音,适于多个社交平台。...
阅读原文

Hertz-Dev – Standard Intelligence推出8.5亿参数的开源音频模型

Hertz-Dev是Standard Intelligence推出的开源音频模型,拥有8.5亿参数。Hertz-Dev包括音频自动编码器hertz-codec、音频VAE学习先验hertz-vae和一个66亿参数的...
阅读原文

逗哥配音 – AI在线配音平台,支持声音克隆创建个性化配音效果

逗哥配音是在线配音平台,专为短视频创作者设计,提供多种声音选择和配音制作功能。平台拥有超过500万用户,包括众多短视频达人。逗哥配音的特色功能包括声音...
阅读原文

OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音

OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3.5亿参数。OuteTTS具备...
阅读原文
12