AIGC动态欢迎阅读
原标题:刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
关键字:语音,模型,解读,音频,能力
文章来源:机器之心
内容字数:0字
内容摘要:
机器之心原创
作者:杜伟、蛋酱今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用户随时打断,充分感知到用户的情绪并给予回应。
大家突然发现,原来 AI 语音通话还能这么玩?
但由于种种原因,用户们等了好久才等到 OpenAI 开放 ChatGPT 的高级语音功能,目前仅 Plus 和 Team 用户可体验,且这些用户每天也有使用时长限制。
不过现在,国内用户也有了同样丝滑的实时语音交互应用,重点是:免费开放,无需等待。
10 月 25 日,智谱清言宣布全量上线「情感语音通话」功能,任何用户都可以立即获得端到端情感语音体验。
对标 GPT-4o,智谱清言「情感语音通话」在响应和打断速度、情绪感知情感共鸣、语音可控表达、多语言多方言等方面实现了突破。简单来说,「情感语音通话」提供了一个真人一般的对话伙伴,而不仅仅是一个文字的朗读者。精通各种方言,比如这段北京烤鸭的介绍,那叫一个地道:与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,
原文链接:刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
联系作者
文章来源:机器之心
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...