OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音

OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音

AIGC动态欢迎阅读

原标题:OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音
关键字:政策,声音,技术,语音,语言
文章来源:夕小瑶科技说
内容字数:5389字

内容摘要:


夕小瑶科技说 原创作者 | 付奶茶OpenAI 又带来了一项超酷的进展!周五推出了一项名为 Voice Engine 的语音引擎,仅凭一段15秒的声音样本,便能够精准模仿出那个人的声音。
Voice Engine 的独特之处在于,它能通过简单的文本输入和短短音频样本,创造出非常接近原始说话者的自然声音。这意味着无论你让它读什么语言的文字,都能以那个人独有的声音风格朗读,效果既逼真又充满感情。
总而言之,OpenAI 通过这项新技术展示了人工智能复制人声的惊人可能性,接下来让我们一起看下吧~
Voice Engine 两年前已开始研发事实上,OpenAI 早在 2022 年末便启动了 Voice Engine 的开发,并已利用此技术为其文本到语音 API、ChatGPT Voice 以及朗读功能装配了预设声音。
在技术成功开发后,OpenAI 并未立即向市场全面推广,而是选择与一小群早期测试者“小心翼翼”地合作,共同探索其应用可能性和潜在风险。
在与 TechCrunch 的采访中,OpenAI 产品团队成员 Jeff Harris 透露,该模型是在“已获授权和公开可用数据的结合”上进行


原文链接:OpenAI 推出语音引擎,只需15秒样本,即能重建任何人的声音

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员,覆盖500多家海内外机构投资人,互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...