清华系出手，推出全面对标Sora的视频大模型

AIGC动态2年前 (2024)发布智东西

AIGC动态欢迎阅读

原标题：清华系出手，推出全面对标Sora的视频大模型
关键字：视频,字节跳动,模型,镜头,架构
文章来源：智东西
内容字数：5278字

内容摘要：

中国首个长时长、高一致性、高动态性视频大模型Vidu发布。
作者|ZeR0
编辑|漠影
智东西4月27日报道，在今日举行的2024中关村论坛人工智能主题日未来人工智能先锋论坛上，清华大学教授、生数科技首席科学家朱军宣布，生数科技与清华大合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。
根据公开融资信息，成立于去年3月的生数科技，是当前主要国内累计融资额及估值最高的类Sora创企，迄今已完成数亿元融资，投资方包括百度风投、智谱AI、蚂蚁集团以及创始成员多数来自于原字节跳动投资团队的锦秋基金。
朱军现场展示了Vidu与Pika、Gen-2、Sora等行业现有文生视频大模型的生成视频效果对比。他评价说，Vidu在16秒长期保持和语义理解等方面表现得非常突出。
▲使用相同提示词，Vidu与Pika、Gen-2生成视频对比
▲使用相同提示词，Vidu与Sora生成视频对比
▲Vidu生成视频的部分动图
Vidu能根据文本描述直接生成16秒高质量视频，且生成视频流畅连贯，没有明显的插帧现象。据介绍，这是因为Vidu采用的是“一步到位”的生成方式，与Sora一样，文本到视

原文链接：清华系出手，推出全面对标Sora的视频大模型