音频驱动 - OpenI

音频驱动

Infinite Talk AI

音频驱动的唇形同步生成器，可将图片转为无限长度生动视频，免费试用。

InfiniteTalk AI

音频驱动全身视频配音平台，支持稀疏帧控制和长序列图像到视频生成。

SyncAnimation

SyncAnimation 是一种基于 NeRF 的音频驱动实时生成说话头像和上半身动作的技术框架。

一个基于音频驱动的实时2D聊天头像生成模型，可在仅使用CPU的设备上实现30fps的实时推理。

基于流匹配的音频驱动说话人像视频生成方法

端到端音频驱动的人体动画框架

Loopy model

Loopy，仅凭音频驱动肖像头像，实现逼真动态。

基于扩散模型的音频驱动人像和动物图像动画技术

EchoMimicV2

EchoMimicV2：实现逼真、简化、半身人体动画的技术。

音频驱动的表情丰富的视频生成模型

生成逼真、唇同步的说唱视频

EMO是一款表情丰富的音频驱动肖像视频生成框架，通过输入一张参考图像和音频，生成具有丰富面部表情和不同头部姿势的角色视频，适用于音乐视频制作、影视制作和虚拟主播等场景。，EMO官网入口网址