标签:语音

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

FunAudioLLM团队 投稿量子位 | 公众号 QbitAIOpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。 刚刚,阿里通...
阅读原文

成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好!

整理 | 华卫 想象一下,一个 AI 模型可以表达 70 多种情绪,以不同的风格说话,甚至令人信服地模仿口音。并且,它能够同时处理两个音频流,同时听和说。这不...
阅读原文

8人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用

新智元报道编辑:桃子 乔杨 【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平...
阅读原文

OpenAI推迟发布ChatGPT语音模式,但MAC端桌面版ChatGPT上线了

夕小瑶科技说 原创作者 | 21# 还没从OpenAI全面封禁中国API接入的消息缓过来,今日凌晨,OpenAI就再爆新瓜: 推迟至少一个月发布新的 ChatGPT 语音模式 macOS...
阅读原文

今日起,Mac版ChatGPT应用人人可下!GPT-4o语音功能却再鸽一个月

新智元报道编辑:耳朵 庸庸 【新智元导读】今天凌晨,OpenAI官方账号宣布,ChatGPT MAC版本桌面应用程序今日起向公众免费开放使用,但原定于6月底向Plus用户...
阅读原文

耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘

机器之心发布 机器之心编辑部Seed-TTS 是字节跳动豆包大模型团队近期发布的语音生成大模型成果。它生成的语音几乎与真人完全一样,连发音瑕疵也能生成出来,...
阅读原文

重磅!“国奖”放榜:十年来AI领域首个国奖一等奖花落科大讯飞

2023国家科学技术奖放榜!近十年AI领域首个一等奖诞生。 作者|三北 编辑|漠影 智东西6月25日报道,6月24日上午,一场科技盛会在北京召开。 全国科技大会、国...
阅读原文

中国科技「亮剑」!十年来,AI领域项目首次问鼎国家科技奖一等奖

新智元报道编辑:编辑部 【新智元导读】2023年度国家科学技术大奖公布了!今年的评选堪称史上最严、最难,竞争最激烈的一届。这当中,大厂中唯有科大讯飞摘得...
阅读原文

中文大模型竞技场第一:MiniMax海螺AI初体验!

直播预告 | 6月20日晚7点,「智猩猩机器人新青年讲座」第8讲正式开讲,清华大学THUNLP lab在读博士胡锦毅将直播讲解《面向多模态大模型的具身智能平台LEGENT...
阅读原文

字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑

机器之心报道 编辑:Panda通过高保真合成语音与真人语音无异。 首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI ...
阅读原文

发布即被山寨?字节跳动推出语音生成模型数小时后就被“盗版”,作者直呼离谱!

作者 | 褚杏娟 近日,被称为 GPT-4o 平替的 ChatTTS 文本转语音开源项目爆火。没多久,字节跳动也推出了自己的语音生成模型 Seed-TTS,能生成与人类语音几乎...
阅读原文

嘴炮王者Tyler1化身免费AI陪玩,帮你在英雄联盟中打爆三路,轻松上分

机器之心报道 编辑:佳琪、大盘鸡实时游戏内的指导和分析,助力你的上分路。《英雄联盟》(LOL)作为经典 MOBA 游戏,自 2009 年发布至今,因其深度策略性及...
阅读原文

苹果OpenAI曝出「数十亿美元」合作,微软急了!纳德拉紧急约谈奥特曼

新智元报道编辑:编辑部 【新智元导读】刚刚,苹果和OpenAI曝出价值数十亿美元的合作,这也让微软CEO纳德拉直接急眼了!根据内部消息,纳德拉已经紧急约谈了A...
阅读原文

爆火ChatTTS突破开源语音天花板,3天斩获9k的Star量

机器之心报道 编辑:陈萍、佳琪未来人与人的交流,难道是这个样?近日,一个名为 ChatTTS 文本转语音项目爆火出圈,引来大家极大的关注。短短三天时间,在 Gi...
阅读原文

2D头像生成3D虚拟人开视频会,谷歌新作让人难绷

机器之心报道 编辑:泽南、亚鹂未来人与人的交流,难道是这个样?开视频远程会议的时候,很多人都不喜欢打开摄像头。即使开了,在界面上大家也都被框在不同的...
阅读原文
13456712