旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

AIGC动态欢迎阅读

原标题:旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情
关键字:视频,表情,数据,研究院,肖像
文章来源:机器之心
内容字数:0字

内容摘要:


机器之心发布
机器之心编辑部日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。MegActor 所生成的视频长度,取决于给定的驱动视频的长度。与阿里 EMO、微软 VASA 等最新涌现的 AI 视频模型不同,旷视 MegActor 将采用开源的方式,提供给开发者社区使用。MegActor 能够呈现出丝毫毕现的效果,面部细节更加丰富自然,画质更出色。为了进一步展示其泛化性,MegActor 甚至可以让 VASA 里面的人物肖像和它们的视频彼此组合生成,得到表情生动的视频生成结果。即使是对比阿里 EMO 的官方 Case,MegActor 也能生成近似的结果。总的来说,不管是让肖像开口说话,让肖像进行唱歌 Rap,还是让肖像模仿各种搞怪的表情包,MegActor 都可以得到非常逼真的生成效果。论文:https://arxiv.org/abs/2405.20851
代码地址:https://github.com/megvii-r


原文链接:旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...