标签:音频
微软刚刚发布了VASA-1:单张照片生成超现实真人视频,还没开源但是性能SOTA
夕小瑶科技说 原创作者 | 任同学还记得阿里巴巴那个让照片说话的EMO项目吗?如果还没有看过相关的报道,可以看一下我们之前发过的文章哦: 比阿里EMO抢先开源...
谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用
丰色 发自 凹非寺量子位 | 公众号 QbitAI谷歌最强大模型Gemini 1.5 Pro今天起,“全面”对外开放。 目前完全免费,开发者可以通过API调用的方式使用,普通玩家...
音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车
新智元报道编辑:Aeneas 好困 【新智元导读】200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio 2.0,可以创作长达...
15 秒音频即可“复制”原声!但OpenAI 担心新语音模型被滥用而限制发行
整理 | 傅宇琪 3 月 30 日,OpenAI 在官网首次展示了名为“ Voice Engine ”的语音生成模型,该模型能够通过文本输入和仅仅 15 秒的音频样本生成与原始说话者声...
音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型今日启动邀测
机器之心发布 机器之心编辑部4 月 2 日,昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。 本轮邀测将开放 1000 个免费名额,面向...
OpenAI首次官宣语音项目,配音演员警报拉响
机器之心报道 编辑:陈萍文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天,OpenAI 在语音领域又带给我们一点点震撼,通过文本...
CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作
机器之心专栏 机器之心编辑部AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节,可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。 ...
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
新智元报道编辑:alan 【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!只需...
人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!
编译 | 核子可乐、Tina 输入音乐流派风格、内容主题,仅需几秒钟内就可生成 2 分钟音乐...... 近日,人工智能初创企业 Suno 对外发布了 Suno 模型 V3 版本,...
妇女节特刊 | 上海交大吴梦玥:用言语智能技术,为精神疾病开出第一张诊疗单
作者:李宝珠 编辑:三羊 恰逢 2024 年国际妇女节,HyperAI超神经有幸与上海交通大学计算机系副教授、博士生导师吴梦玥,进行了一次深度访谈,在一步步深入了...
国产 AI 视频也惊艳!阿里新技术让高启强化身罗翔普法,小李子在线唱 rap
才几个月的功夫,AI 视频生成技术就像是吃了兴奋剂一样,卷得飞起。 Sora 的余温尚未过去,阿里就带着它最新的 AI 视频生成研究成果 EMO 来「炸街」了。 谁能...
AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap
衡宇 梦晨 发自 凹非寺量子位 | 公众号 QbitAISora之后,居然还有新的AI视频模型,能惊艳得大家狂转狂赞! 有了它,《狂飙》大反派高启强化身罗翔,都能给大...
国产神级AI登场!高启强化身罗翔,蔡徐坤变Rap之王,还跟Sora联动
17个演示视频+技术解读,揭秘阿里如何让任何人开口说话。 作者|香草 编辑|心缘 开局一张图,后期可以全靠AI了! 智东西2月29日报道,继视频生成模型Sora横空...
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
机器之心报道 机器之心编辑部有了阿里的 EMO,AI 生成或真实的图像「动起来说话或唱歌」变得更容易了。 最近,以 OpenAI Sora 为代表的文生视频模型又火了起...
Adobe推出文生音乐工具,是音乐制作和编辑领域的“Photoshop”
点击上方蓝字关注我们“Adobe推出全新AI实验项目“Project Music GenAI Control”,旨在让用户通过文本输入即可定制音乐,无需专业音频技能。该工具允许用户调整...