标签:语音

a16z 发布 AI 语音 Agent 图谱:重塑通话的时机到了

Phone calls are an API to the world — and AI takes this to the next level!电话呼叫是通向世界的 API —— 而人工智能将其提升到了一个新的水平。 本篇文章...
阅读原文

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

白交 发自 凹非寺量子位 | 公众号 QbitAI更适配中文的语音大模型来了—— 来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30...
阅读原文

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

机器之心报道 机器之心编辑部不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇...
阅读原文

如何使用新的 ChatGPT macOS 应用程序

点击上方蓝字关注我们“OpenAI 推出了 macOS 专用的 ChatGPT 桌面应用,具备语音模式和临时聊天功能,支持图片上传和截图工具,增强了视觉交流。应用提供个性...
阅读原文

新融资 1.25 亿,用户超 1000 万,Suno 打算如何「改造」音乐行业?

昨天,Suno 在 X 上宣布成功完成了 1.25 亿美元的 B 轮融资。本轮投资者中,有风险投资公司 Lightspeed Venture Partners,还包括风险投资基金 Founders Coll...
阅读原文

寡姐怒斥ChatGPT盗用自己声音,OpenAI:已下架,但真没模仿她

克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI的新王炸GPT-4o还没全面铺开,就摊上事了! 抓马的是,此次推出的“视频通话”功能一度被称为电影《Her》现实...
阅读原文

ChatGPT语音酷似「寡姐」遭炮轰!奥特曼紧急下架「Sky」

新智元报道编辑:庸庸 好困 【新智元导读】斯嘉丽·约翰逊在一份措辞激烈的声明中表示,在她拒绝为ChatGPT配音的邀请后,OpenAI仍然「厚颜无耻」地模仿了她独...
阅读原文

寡姐怒了,GPT-4o系统配音强行模仿,OpenAI回应删除

机器之心报道 编辑:陈萍、张倩GPT-4o 其中一个声音是不是在模仿斯嘉丽・约翰逊,大家不妨听一下。GPT-4o 的发布,让很多人联想到科幻爱情电影《Her》中的类...
阅读原文

Nature子刊 | 加州理工学院利用脑机接口实时解码内心言语

语音脑机接口(BMIs)将大脑神经信号转换为单词或音频输出,能够让因疾病或受伤而失去语言能力的人能够进行交流。虽然在语音、尝试和模拟语音解码方面取得了...
阅读原文

GPT-4o用不上,国产平替海螺AI可以先试试

一水 发自 凹非寺量子位 | 公众号 QbitAIAI领域本周都卷起来对话式交互。 前有OpenAI推出实时视频通话如真人的GPT-4o,后有谷歌与之类似的Astra。 但不论是GP...
阅读原文

清华团队研发脑启发AI模型,为感知信息处理提供全新范例

来源:脑机接口社区 运营/排版:何晨龙 人类天生具有分离各种音频信号的能力,比如区分不同的说话者的声音、或将声音与背景噪音区分开来。这种天生的能力被称...
阅读原文

抢先体验 GPT-4o 后,我们发现了这些发布会没说的细节

AI产品 的生活化 就是魔法Google 应该向 OpenAI 的营销取取经。 Sora 打出模拟物理世界的概念,GPT-4o 颠覆了我们对语音助手的想象,现实版 Her 指日可待了。...
阅读原文

李志飞:GPT-4o,让全能虚拟个人助理成为可能

作为出门问问创始人,创业 10 年来,李志飞主导开发过语音助手、智能硬件以及多个 AIGC 产品,如魔音工坊、奇妙元。2017 年,出门问问虚拟个人助理(VPA)正...
阅读原文

OpenAI干翻所有语音助手!GPT-4o模型实时语音视频交互强到恐怖,完全免费开放

智东西5月14日报道,今日凌晨1点,抢在谷歌年度开发者大会Google I/O开幕前,OpenAI举办春季线上直播,宣布将推出桌面版ChatGPT,并发布全新旗舰AI模型GPT-4o...
阅读原文

毁灭吧,同声传译,gpt-4o是那个终结者

自从 ChatGPT 出现,我就感觉,同声传译这个行业在未来5~10年会消失。 不过昨天 OpenAI 发布的 gpt-4o,让我感觉,人力同声传译的消失大概也就这1~2年的事。 ...
阅读原文
14567812