标签:语音合成

AI解说大师

AI解说大师是智能影视创作工具,基于先进的数字技术和AI大模型,让用户能够轻松生成原创解说视频。工具具备正版影视素材库、自动生成解说文案、音频和字幕智...

豆包AI视频模型

豆包AI视频模型是字节跳动推出的两款AI视频生成大模型:PixelDance 和 Seaweed 。PixelDance基于DiT结构,擅长理解复杂指令,生成连贯、多主体交互的视频片段...
阅读原文

PDF2Audio

PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的 GPT 模型生成播客脚本,通过文本到语音技术转化为音频。
阅读原文

F5-TTS

F5-TTS是由上海交通大学开源的一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合扩散变换器(DiT)技术。系统在没有额外监督的情况下,...
阅读原文

语鲸

语鲸(LingoWhale)是基于深言科技大模型能力的一款AI阅读工具,通过智能总结、问答、思维导图等功能,帮助用户快速把握文章核心内容和结构。工具支持多端同...
阅读原文

Voice Design

Voice Design是ElevenLabs推出的AI语音生成工具,用户只需描述所需声音的年龄、口音、性别、语调或音高,甚至是虚构角色如精灵、食人魔等,工具能快速生成独...
阅读原文

音鹿

音鹿是AI音频编辑软件,提供文字转语音、海量音色选择、AI翻唱、音频编辑工具等功能。用户能生成不同音色配音文件,上传音色为歌曲配音,适于多个社交平台。...
阅读原文

Hertz-Dev

Hertz-Dev是Standard Intelligence推出的开源音频模型,拥有8.5亿参数。Hertz-Dev包括音频自动编码器hertz-codec、音频VAE学习先验hertz-vae和一个66亿参数的...
阅读原文

逗哥配音

逗哥配音是在线配音平台,专为短视频创作者设计,提供多种声音选择和配音制作功能。平台拥有超过500万用户,包括众多短视频达人。逗哥配音的特色功能包括声音...
阅读原文

OuteTTS

OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3.5亿参数。OuteTTS具备...
阅读原文
123