应用（生成&克隆&迁移&编辑）全搞定！阿里通义提出动画框架Perception-as-Control

本文提出了一种用于协同控制的精细控制可控图像动画框架。

运动应用（生成&克隆&迁移&编辑）全搞定！阿里通义提出动画框架Perception-as-Control

原标题：应用（生成&克隆&迁移&编辑）全搞定！阿里通义提出动画框架Perception-as-Control
文章来源：智猩猩GenAI
内容字数：11562字

本文介绍了一种名为Perception-as-Control的图像动画框架，该框架能够实现对摄像机和物体的精细化协同控制，突破了现有方法在控制粒度和三维感知方面的不足，从而支持多种相关的应用，例如生成、克隆、迁移和编辑。

现有的图像动画方法在控制摄像机和物体时面临以下挑战：

为了解决上述问题，本文提出了Perception-as-Control框架，其核心思想是利用3D感知表示来促进精细化的协同控制。该表示能够被修改和感知，从而将用户意图转化为空间对齐的控制信号。

该框架主要包含以下几个关键技术：

Perception-as-Control框架取得了显著的效果：

实验使用了RealEstate10K和WebVid10M数据集进行训练。结果表明，Perception-as-Control能够有效地进行仅相机控制、仅物体控制以及协同控制。此外，该框架还能够应用于生成、克隆、迁移和编辑等多种任务。

Perception-as-Control框架提出了一种用于协同控制的精细化可控图像动画方法，通过3D感知表示实现了对摄像机和物体的精确且灵活的控制，并支持多种相关的应用，为图像动画领域带来了显著的进步。

文章来源：智猩猩GenAI
作者微信：
作者简介：智猩猩旗下公众号之一，专注于生成式人工智能。

文章版权归作者所有，未经允许请勿转载。

暂无评论...