旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包
关键字：视频,表情,数据,研究院,肖像
文章来源：机器之心
内容字数：0字

内容摘要：

机器之心发布
机器之心编辑部日前，旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架，用户只需输入一张静态的肖像图片，以及一段视频（演讲、表情包、rap）文件，即可生成一段表情丰富、动作一致的 AI 人像视频。MegActor 所生成的视频长度，取决于给定的驱动视频的长度。与阿里 EMO、微软 VASA 等最新涌现的 AI 视频模型不同，旷视 MegActor 将采用开源的方式，提供给开发者社区使用。MegActor 能够呈现出丝毫毕现的效果，面部细节更加丰富自然，画质更出色。为了进一步展示其泛化性，MegActor 甚至可以让 VASA 里面的人物肖像和它们的视频彼此组合生成，得到表情生动的视频生成结果。即使是对比阿里 EMO 的官方 Case，MegActor 也能生成近似的结果。总的来说，不管是让肖像开口说话，让肖像进行唱歌 Rap，还是让肖像模仿各种搞怪的表情包，MegActor 都可以得到非常逼真的生成效果。论文：https://arxiv.org/abs/2405.20851
代码地址：https://github.com/megvii-r

原文链接：旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包