14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍

AIGC动态3年前 (2023)发布机器之心

AIGC动态欢迎阅读

原标题：14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍
关键字：模型,特征,注意力,研究者,编辑
文章来源：机器之心
内容字数：3895字

内容摘要：

机器之心报道
机器之心编辑部Meta的视频合成新框架又给了我们一点小小的震撼。就今天的人工智能发展水平来说，文生图、图生视频、图像/视频风格迁移都已经不算什么难事。
生成式 AI 天赋异禀，能够毫不费力地创建或修改内容。尤其是图像编辑，在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下，经历了重大发展。这股浪潮催生了大量图像编辑和内容创建应用。
基于图像的生成模型所取得的成就基础上，下一个挑战的领域必然是为其增加「时间维度」，从而实现轻松而富有创意的视频编辑。
一种直接策略是使用图像模型逐帧处理视频，然而，生成式图像编辑本身就具有高变异性—即使根据相同的文本提示，也存在无数种编辑给定图像的方法。如果每一帧都编辑，很难保持时间上的一致性。
在最近的一篇论文中，来自Meta GenAI团队的研究者提出了 Fairy——通过对图像编辑扩散模型进行「简单的改编」，大大增强了AI在视频编辑上的表现。
以下是Fairy的编辑视频效果展示：Fairy 生成 120 帧 512×384 视频（4 秒时长，30 FPS）的时间仅为 14 秒，比之前的方法至少快 44 倍。一项涉及 1000

原文链接：14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍