清华团队国产“Sora”火了！画面效果对标OpenAI，长度可达16秒，还能读懂物理规律

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：清华团队国产“Sora”火了！画面效果对标OpenAI，长度可达16秒，还能读懂物理规律
关键字：视频,画面,模型,架构,镜头
文章来源：量子位
内容字数：8518字

内容摘要：

允中发自凹非寺量子位 | 公众号 QbitAISora席卷世界，也掀起了全球竞逐AI视频生成的热潮。
就在今天，国内又有一支短片引发关注。
视频来自生数科技联合清华大学最新发布的视频大模型「Vidu」。
从官宣消息看，「Vidu」支持一键生成长达16秒、分辨率达1080p的高清视频内容。
更令人惊喜的是，「Vidu」画面效果非常接近Sora，在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都十分出色，而且还能虚构出真实世界不存在的超现实主义画面，这是当前的视频生成模型难以实现的。
并且实现这般效果，背后团队只用了两个月的时间。
全面对标Sora3月中旬，生数科技联合创始人兼CEO唐家渝就曾公开表示：“今年内一定能达到Sora目前版本的效果。”
现在，在生成时长、时空一致性、镜头语言、物理模拟等方面，确实能看到「Vidu」在短时间内已经逼近Sora水平。
长度突破10秒大关「Vidu」生成的视频不再是持续几秒的「GIF」，而是达到了16秒，并且做到了画面连续流畅，且有细节、逻辑连贯。
尽管都是画面，但几乎不会出现穿模、鬼影、不符合现实规律的问题。
△提示：一艘木头玩具船

原文链接：清华团队国产“Sora”火了！画面效果对标OpenAI，长度可达16秒，还能读懂物理规律