一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

AIGC动态8个月前发布 量子位
11 0 0

一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

AIGC动态欢迎阅读

原标题:一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码
关键字:视频,模型,研究人员,连贯性,分辨率
文章来源:量子位
内容字数:3198字

内容摘要:


鱼羊 发自 凹非寺量子位 | 公众号 QbitAI谷歌一出手,又把AI视频生成卷上了新高度。
一句话生成视频,现在在名为Lumiere的AI操刀下,可以是酱婶的:
△“阳光明媚,帆船在湖中航行”如此一致性和质量,再次点燃了网友们对AI视频生成的热情:谷歌加入战局,又有好戏可看了。
不止是文生视频,Lumiere把Pika的“一键换装”也复现了出来。
左谷歌右pika,同样是选中区域一句话完成视频编辑,你pick哪一边?
让图片中静止的火焰跃动起来,也同样一选就能完成:
还有图片转视频:
视频风格化:
总之就是主打一个质量又高又全能。
更多细节,我们论文扒起~
用于视频生成的时空扩散模型Lumiere旨在解决以往视频生成中存在的几个关键问题:
真实性
多样化
运动的连贯性
在此前的方法中,常见的做法是,扩散模型先生成一些稀疏的关键帧,而后通过一系列时间超分辨率(TSR)模型来填补关键帧之间的空白,接着再用空间超分辨率模型获取高清视频结果。
可以想见,在全局连贯性上,这样的做法存在先天的缺陷。
Lumiere的创新点在于,提出了时空U-Net(STU-Net)架构:将视频在空间和时间两个维


原文链接:一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度,网友:竞赛加码

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...