SyncAnimation 是一种基于 NeRF 的音频驱动实时生成说话头像和上半身动作的技术框架。
一个基于音频驱动的实时2D聊天头像生成模型,可在仅使用CPU的设备上实现30fps的实时推理。
基于流匹配的音频驱动说话人像视频生成方法
端到端音频驱动的人体动画框架
Loopy,仅凭音频驱动肖像头像,实现逼真动态。
基于扩散模型的音频驱动人像和动物图像动画技术
EchoMimicV2:实现逼真、简化、半身人体动画的技术。
音频驱动的表情丰富的视频生成模型
生成逼真、唇同步的说唱视频
EMO是一款表情丰富的音频驱动肖像视频生成框架,通过输入一张参考图像和音频,生成具有丰富面部表情和不同头部姿势的角色视频,适用于音乐视频制作、影视制作和虚拟主播等场景。,EMO官网入口网址