AIGC动态欢迎阅读
原标题:开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
关键字:模型,音频,报告,语音,卷积
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:alan
【新智元导读】两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!前段时间技惊四座、剑指GPT-4o的实时语音模型Moshi,终于开源了!
自然,情绪丰富,随意打断,拒绝呆板和回合制!
大神Karpathy体验之后也表示:nice~
来自法国的初创团队Kyutai,于7月初发布了这个对标GPT-4o的神奇的端到端语音模型。
2个多月后的今天,他们兑现了自己的承诺,将代码、模型权重和一份超长的技术报告一股脑开源。
论文地址:https://kyutai.org/Moshi.pdf
开源代码:https://github.com/kyutai-labs/moshi
开放权重:https://huggingface.co/collections/kyutai
在海的那一边,GPT-4o的语音模式还没有完全端上来,这边的模型已经免费送了。
大家可以去官网(moshi.chat)在线免费体验,相比于平时你问我答的AI语音助手,这种「像人一样」的方式还是很奇特的。
整个模型的参数量为7.69B,pytorch平
原文链接:开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
联系作者
文章来源:新智元
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...