标签：音频

微软刚刚发布了VASA-1：单张照片生成超现实真人视频，还没开源但是性能SOTA

夕小瑶科技说原创作者 | 任同学还记得阿里巴巴那个让照片说话的EMO项目吗？如果还没有看过相关的报道，可以看一下我们之前发过的文章哦：比阿里EMO抢先开源...

阅读原文

AIGC动态

2年前 (2024)

谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

丰色发自凹非寺量子位 | 公众号 QbitAI谷歌最强大模型Gemini 1.5 Pro今天起，“全面”对外开放。目前完全免费，开发者可以通过API调用的方式使用，普通玩家...

阅读原文

AIGC动态

2年前 (2024)

音乐ChatGPT 2.0来了！AI作曲家被踢馆，亲测周杰伦爆款大翻车

新智元报道编辑：Aeneas 好困【新智元导读】200名音乐人联名信抗议的消息刚出，Stability AI的新音乐工具就来了！刚刚发布的Stable Audio 2.0，可以创作长达...

阅读原文

AIGC动态

2年前 (2024)

15 秒音频即可“复制”原声！但OpenAI 担心新语音模型被滥用而限制发行

整理 | 傅宇琪 3 月 30 日，OpenAI 在官网首次展示了名为“ Voice Engine ”的语音生成模型，该模型能够通过文本输入和仅仅 15 秒的音频样本生成与原始说话者声...

阅读原文

AIGC动态

2年前 (2024)

音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型今日启动邀测

机器之心发布机器之心编辑部4 月 2 日，昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。本轮邀测将开放 1000 个免费名额，面向...

阅读原文

AIGC动态

2年前 (2024)

OpenAI首次官宣语音项目，配音演员警报拉响

机器之心报道编辑：陈萍文本输入和一个 15 秒的音频样本就能生成与原始说话者非常相似的自然声音。今天，OpenAI 在语音领域又带给我们一点点震撼，通过文本...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 面部+肢体动画，一个框架搞定从音频生成数字人表情与动作

机器之心专栏机器之心编辑部AI 数字人面部与肢体的驱动算法作为数字人研发的重要环节，可以大幅度降低 VR Chat、虚拟直播和游戏 NPC 等领域中的驱动成本。 ...

阅读原文

AIGC动态

2年前 (2024)

一张图即出AI视频！谷歌全新扩散模型，让人物动起来

新智元报道编辑：alan 【新智元导读】近日，来自谷歌的研究人员发布了多模态扩散模型VLOGGER，只需一张照片，和一段音频，就能直接生成人物说话的视频！只需...

阅读原文

AIGC动态

2年前 (2024)

人人都能当周杰伦！Suno作曲，ChatGPT写词，网友用Transformer造出神曲！

编译 | 核子可乐、Tina 输入音乐流派风格、内容主题，仅需几秒钟内就可生成 2 分钟音乐...... 近日，人工智能初创企业 Suno 对外发布了 Suno 模型 V3 版本，...

阅读原文

AIGC动态

2年前 (2024)

妇女节特刊 | 上海交大吴梦玥：用言语智能技术，为精神疾病开出第一张诊疗单

作者：李宝珠编辑：三羊恰逢 2024 年国际妇女节，HyperAI超神经有幸与上海交通大学计算机系副教授、博士生导师吴梦玥，进行了一次深度访谈，在一步步深入了...

阅读原文

AIGC动态

2年前 (2024)

国产 AI 视频也惊艳！阿里新技术让高启强化身罗翔普法，小李子在线唱 rap

才几个月的功夫，AI 视频生成技术就像是吃了兴奋剂一样，卷得飞起。 Sora 的余温尚未过去，阿里就带着它最新的 AI 视频生成研究成果 EMO 来「炸街」了。谁能...

阅读原文

AIGC动态

2年前 (2024)

AI视频又炸了！照片+声音变视频，阿里让Sora女主唱歌小李子说rap

衡宇梦晨发自凹非寺量子位 | 公众号 QbitAISora之后，居然还有新的AI视频模型，能惊艳得大家狂转狂赞！有了它，《狂飙》大反派高启强化身罗翔，都能给大...

阅读原文

AIGC动态

2年前 (2024)

国产神级AI登场！高启强化身罗翔，蔡徐坤变Rap之王，还跟Sora联动

17个演示视频+技术解读，揭秘阿里如何让任何人开口说话。作者|香草编辑|心缘开局一张图，后期可以全靠AI了！智东西2月29日报道，继视频生成模型Sora横空...

阅读原文

AIGC动态

2年前 (2024)

让Sora东京女郎唱歌、高启强变声罗翔，阿里人物口型视频生成绝了

机器之心报道机器之心编辑部有了阿里的 EMO，AI 生成或真实的图像「动起来说话或唱歌」变得更容易了。最近，以 OpenAI Sora 为代表的文生视频模型又火了起...

阅读原文

AIGC动态

2年前 (2024)

Adobe推出文生音乐工具，是音乐制作和编辑领域的“Photoshop”

点击上方蓝字关注我们“Adobe推出全新AI实验项目“Project Music GenAI Control”，旨在让用户通过文本输入即可定制音乐，无需专业音频技能。该工具允许用户调整...

阅读原文

AIGC动态

2年前 (2024)

1 2 345 6