AIGC动态欢迎阅读
原标题:谷歌发布新大语言模型:零样本生成10秒视频达SOTA!网友:压力给到Runway/Pika
关键字:视频,模型,画面,动作,文本
文章来源:量子位
内容字数:3202字
内容摘要:
明敏 发自 凹非寺量子位 | 公众号 QbitAI你敢信?大熊猫都会打牌了!
看这毛茸茸的脑袋、抓牌的动作……
而这其实都是AI生成的,还是零样本那种。
这就是谷歌最新大语言模型VideoPoet。
它不仅没有用视频领域常用的扩散模型,还零样本实现了SOTA。相较于此前一些模型,画面更加稳定、动作更加逼真,清晰度也直线up。
和Bard再合作一下,轻松搞定1分钟长的视频小片,从脚本到画面全部不用人类插手。
这效果,让网友们直呼:视频生成进化速度也太快了吧。
不少人都表示想玩!
有人还说,VideoPoet效果这么好,看来Runway和Pika要加速了!
画面逼真动作稳定具体来看VideoPoet的能力非常全面。包括:
文本-视频
图像-视频
视频编辑
风格化处理
画面补充
文本到视频任务,视频输出长度可调整,而且可以基于文本内容应用一系列动作和风格。
图像到视频任务,则能让静态图片动起来。比如一些世界名画和照片,都可生成视频。
同时也能调整视频风格,需要额外输入一些文本,然后模型会预测视频的光照和深度信息。
比如输入“铁狮子在熔炉的火光中咆哮”,原本无厘头的太阳花狮子就变得凶猛威严起来
原文链接:谷歌发布新大语言模型:零样本生成10秒视频达SOTA!网友:压力给到Runway/Pika
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...