标签:音频

谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用

丰色 发自 凹非寺量子位 | 公众号 QbitAI谷歌最强大模型Gemini 1.5 Pro今天起,“全面”对外开放。 目前完全免费,开发者可以通过API调用的方式使用,普通玩家...
阅读原文

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

新智元报道编辑:Aeneas 好困 【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio 2.0,可以创作长达...
阅读原文

15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行

整理 | 傅宇琪 3 月 30 日,OpenAI 在官网首次展示了名为“ Voice Engine ”的语音生成模型,该模型能够通过文本输入和仅仅 15 秒的音频样本生成与原始说话者声...
阅读原文

音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型今日启动邀测

机器之心发布 机器之心编辑部4 月 2 日,昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。 本轮邀测将开放 1000 个免费名额,面向...
阅读原文

CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作

机器之心专栏 机器之心编辑部AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节,可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。 ...
阅读原文

OpenAI首次官宣语音项目,配音演员警报拉响

机器之心报道 编辑:陈萍文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本...
阅读原文

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

新智元报道编辑:alan 【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!只需...
阅读原文

人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!

编译 | 核子可乐、Tina 输入音乐流派风格、内容主题,仅需几秒钟内就可生成 2 分钟音乐...... 近日,人工智能初创企业 Suno 对外发布了 Suno 模型 V3 版本,...
阅读原文

妇女节特刊 | 上海交大吴梦玥:用言语智能技术,为精神疾病开出第一张诊疗单

作者:李宝珠 编辑:三羊 恰逢 2024 年国际妇女节,HyperAI超神经有幸与上海交通大学计算机系副教授、博士生导师吴梦玥,进行了一次深度访谈,在一步步深入了...
阅读原文

国产 AI 视频也惊艳!阿里新技术让高启强化身罗翔普法,小李子在线唱 rap

才几个月的功夫,AI 视频生成技术就像是吃了兴奋剂一样,卷得飞起。 Sora 的余温尚未过去,阿里就带着它最新的 AI 视频生成研究成果 EMO 来「炸街」了。 谁能...
阅读原文

AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap

衡宇 梦晨 发自 凹非寺量子位 | 公众号 QbitAISora之后,居然还有新的AI视频模型,能惊艳得大家狂转狂赞! 有了它,《狂飙》大反派高启强化身罗翔,都能给大...
阅读原文

国产神级AI登场!高启强化身罗翔,蔡徐坤变Rap之王,还跟Sora联动

17个演示视频+技术解读,揭秘阿里如何让任何人开口说话。 作者|香草 编辑|心缘 开局一张图,后期可以全靠AI了! 智东西2月29日报道,继视频生成模型Sora横空...
阅读原文

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

机器之心报道 机器之心编辑部有了阿里的 EMO,AI 生成或真实的图像「动起来说话或唱歌」变得更容易了。 最近,以 OpenAI Sora 为代表的文生视频模型又火了起...
阅读原文

Adobe推出文生音乐工具,是音乐制作和编辑领域的“Photoshop”

点击上方蓝字关注我们“Adobe推出全新AI实验项目“Project Music GenAI Control”,旨在让用户通过文本输入即可定制音乐,无需专业音频技能。该工具允许用户调整...
阅读原文

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

新智元报道编辑:编辑部 【新智元导读】谷歌Research Lead,负责VideoPoet项目的蒋路,即将加入TikTok,负责视频生成AI的开发。谷歌VideoPoet项目Research Le...
阅读原文