标签:音频

在线教程丨刘强东数字人首秀交易额破5千万!用GeneFace++ 生成实时说话数字人

作者:十九 编辑:李宝珠,三羊 封面图来源:GeneFace++ GeneFace++:输入一段语音,就能生成目标人脸的说话视频。近日,京东创始人刘强东化身「采销东哥 AI ...
阅读原文

微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人

新智元报道编辑:LRS 【新智元导读】想要做出一段能够「以假乱真的人物说话视频」的门槛到底低到什么程度了?仅需一张照片加一段音频,就能生成一段堪称真实...
阅读原文

微软刚刚发布了VASA-1:单张照片生成超现实真人视频,还没开源但是性能SOTA

夕小瑶科技说 原创作者 | 任同学还记得阿里巴巴那个让照片说话的EMO项目吗?如果还没有看过相关的报道,可以看一下我们之前发过的文章哦: 比阿里EMO抢先开源...
阅读原文

谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用

丰色 发自 凹非寺量子位 | 公众号 QbitAI谷歌最强大模型Gemini 1.5 Pro今天起,“全面”对外开放。 目前完全免费,开发者可以通过API调用的方式使用,普通玩家...
阅读原文

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

新智元报道编辑:Aeneas 好困 【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio 2.0,可以创作长达...
阅读原文

15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行

整理 | 傅宇琪 3 月 30 日,OpenAI 在官网首次展示了名为“ Voice Engine ”的语音生成模型,该模型能够通过文本输入和仅仅 15 秒的音频样本生成与原始说话者声...
阅读原文

音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型今日启动邀测

机器之心发布 机器之心编辑部4 月 2 日,昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。 本轮邀测将开放 1000 个免费名额,面向...
阅读原文

OpenAI首次官宣语音项目,配音演员警报拉响

机器之心报道 编辑:陈萍文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本...
阅读原文

CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作

机器之心专栏 机器之心编辑部AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节,可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。 ...
阅读原文

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

新智元报道编辑:alan 【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!只需...
阅读原文

人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!

编译 | 核子可乐、Tina 输入音乐流派风格、内容主题,仅需几秒钟内就可生成 2 分钟音乐...... 近日,人工智能初创企业 Suno 对外发布了 Suno 模型 V3 版本,...
阅读原文

妇女节特刊 | 上海交大吴梦玥:用言语智能技术,为精神疾病开出第一张诊疗单

作者:李宝珠 编辑:三羊 恰逢 2024 年国际妇女节,HyperAI超神经有幸与上海交通大学计算机系副教授、博士生导师吴梦玥,进行了一次深度访谈,在一步步深入了...
阅读原文

国产 AI 视频也惊艳!阿里新技术让高启强化身罗翔普法,小李子在线唱 rap

才几个月的功夫,AI 视频生成技术就像是吃了兴奋剂一样,卷得飞起。 Sora 的余温尚未过去,阿里就带着它最新的 AI 视频生成研究成果 EMO 来「炸街」了。 谁能...
阅读原文

AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap

衡宇 梦晨 发自 凹非寺量子位 | 公众号 QbitAISora之后,居然还有新的AI视频模型,能惊艳得大家狂转狂赞! 有了它,《狂飙》大反派高启强化身罗翔,都能给大...
阅读原文

国产神级AI登场!高启强化身罗翔,蔡徐坤变Rap之王,还跟Sora联动

17个演示视频+技术解读,揭秘阿里如何让任何人开口说话。 作者|香草 编辑|心缘 开局一张图,后期可以全靠AI了! 智东西2月29日报道,继视频生成模型Sora横空...
阅读原文