OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”

OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”

AIGC动态欢迎阅读

原标题:OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音
关键字:语音,声音,人工智能,说话,语言
文章来源:人工智能学家
内容字数:2952字

内容摘要:


今日凌晨,OpenAI 在官网分享了他们在 AI 语音合成方面的一些进展——公布了一个名为“语音引擎”(Voice Engine)的模型的小规模预览的初步见解和结果。
据介绍,该模型使用文本输入和单个 15 秒音频样本来生成与原始说话者非常相似的自然语音。值得注意的是,一个只有 15 秒样本的小型模型就能生成富有感情和逼真的声音。
早在 2022 年底,OpenAI 便开发了 Voice Engine 并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 语音和朗读。
今天,通过一些实际案例,OpenAI 分享了一些 Voice Engine 的早期应用。
例如,使用 Voice Engine 帮助恢复一名因血管性脑肿瘤而失去流利语言能力的年轻患者的声音。此外,Voice Engine 还可以被用来提供阅读帮助、翻译内容、为不会说话的人群提供支持等。
1)通过声音自然、富有感情的声音为非阅读者和儿童提供阅读帮助
这些声音代表了更广泛的说话者,而不是预设的声音。Age of Learning 是一家教育技术公司,该公司一直在使用 Voice Engine 生成预设的画外音(


原文链接:OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”

联系作者

文章来源:人工智能学家
作者微信:AItists
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...