AIGC动态欢迎阅读
原标题:最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊
关键字:模型,方言,语音,中国电信,数据
文章来源:量子位
内容字数:8271字
内容摘要:
白交 发自 凹非寺量子位 | 公众号 QbitAI更适配中文的语音大模型来了——
来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。
号称最难方言、“魔鬼的语言”的温州话,也不在话下。
还有超自然的语音生成能力。
在2024智算云生态大会上,星辰语音大模型被官宣发布并开源。
要知道,当前语音模型开源开放本来就少,而针对方言更是特定方言特定模型。
开源且支持30种方言,有且只有星辰这么一个。
作为首个完成大语言模型的研发且开源的央企,中国电信现在又在语音模态领域秀起了肌肉。
首个支持30种方言混说语音大模型那就来说道此次发布的能支持最多方言的语音大模型,核心功能主要体现在识别上——
它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。
实际上,它早已获得国际权威赛事的能力认证,以及多个实际场景中落地。
它在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,星辰语音识别大模型斩获了语音识别赛道冠军。
同时在NIST(美国国家标准与技术研究院)举办的低资源粤语电
原文链接:最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...