一句话让姐为我换了N套衣服，谷歌卷出视频生成新高度，网友：竞赛加码

AIGC动态3年前 (2024)发布量子位

一句话让小姐姐为我换了N套衣服，谷歌卷出视频生成新高度，网友：竞赛加码

AIGC动态欢迎阅读

原标题：一句话让姐为我换了N套衣服，谷歌卷出视频生成新高度，网友：竞赛加码
关键字：视频,模型,研究人员,连贯性,分辨率
文章来源：量子位
内容字数：3198字

内容摘要：

鱼羊发自凹非寺量子位 | 公众号 QbitAI谷歌一出手，又把AI视频生成卷上了新高度。
一句话生成视频，现在在名为Lumiere的AI操刀下，可以是酱婶的：
△“阳光明媚，帆船在湖中航行”如此一致性和质量，再次点燃了网友们对AI视频生成的热情：谷歌加入战局，又有好戏可看了。
不止是文生视频，Lumiere把Pika的“一键换装”也复现了出来。
左谷歌右pika，同样是选中区域一句话完成视频编辑，你pick哪一边？
让图片中静止的火焰跃动起来，也同样一选就能完成：
还有图片转视频：
视频风格化：
总之就是主打一个质量又高又全能。
更多细节，我们论文扒起~
用于视频生成的时空扩散模型Lumiere旨在解决以往视频生成中存在的几个关键问题：
真实性
多样化
的连贯性
在此前的方法中，常见的做法是，扩散模型先生成一些稀疏的关键帧，而后通过一系列时间超分辨率（TSR）模型来填补关键帧之间的空白，接着再用空间超分辨率模型获取高清视频结果。
可以想见，在全局连贯性上，这样的做法存在先天的缺陷。
Lumiere的创新点在于，提出了时空U-Net（STU-Net）架构：将视频在空间和时间两个维

原文链接：一句话让姐为我换了N套衣服，谷歌卷出视频生成新高度，网友：竞赛加码