AIGC动态欢迎阅读
原标题:清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
关键字:视频,画面,模型,架构,镜头
文章来源:量子位
内容字数:8518字
内容摘要:
允中 发自 凹非寺量子位 | 公众号 QbitAISora席卷世界,也掀起了全球竞逐AI视频生成的热潮。
就在今天,国内又有一支短片引发关注。
视频来自生数科技联合清华大学最新发布的视频大模型「Vidu」。
从官宣消息看,「Vidu」支持一键生成长达16秒、分辨率达1080p的高清视频内容。
更令人惊喜的是,「Vidu」画面效果非常接近Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都十分出色,而且还能虚构出真实世界不存在的超现实主义画面,这是当前的视频生成模型难以实现的。
并且实现这般效果,背后团队只用了两个月的时间。
全面对标Sora3月中旬,生数科技联合创始人兼CEO唐家渝就曾公开表示:“今年内一定能达到Sora目前版本的效果。”
现在,在生成时长、时空一致性、镜头语言、物理模拟等方面,确实能看到「Vidu」在短时间内已经逼近Sora水平。
长度突破10秒大关「Vidu」生成的视频不再是持续几秒的「GIF」,而是达到了16秒,并且做到了画面连续流畅,且有细节、逻辑连贯。
尽管都是运动画面,但几乎不会出现穿模、鬼影、运动不符合现实规律的问题。
△提示:一艘木头玩具船
原文链接:清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...