AIGC动态欢迎阅读
原标题:清华系出手,推出全面对标Sora的视频大模型
关键字:视频,字节跳动,模型,镜头,架构
文章来源:智东西
内容字数:5278字
内容摘要:
中国首个长时长、高一致性、高动态性视频大模型Vidu发布。
作者|ZeR0
编辑|漠影
智东西4月27日报道,在今日举行的2024中关村论坛人工智能主题日未来人工智能先锋论坛上,清华大学教授、生数科技首席科学家朱军宣布,生数科技与清华大合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。
根据公开融资信息,成立于去年3月的生数科技,是当前主要国内累计融资额及估值最高的类Sora创企,迄今已完成数亿元融资,投资方包括百度风投、智谱AI、蚂蚁集团以及创始成员多数来自于原字节跳动投资团队的锦秋基金。
朱军现场展示了Vidu与Pika、Gen-2、Sora等行业现有文生视频大模型的生成视频效果对比。他评价说,Vidu在16秒长期保持和语义理解等方面表现得非常突出。
▲使用相同提示词,Vidu与Pika、Gen-2生成视频对比
▲使用相同提示词,Vidu与Sora生成视频对比
▲Vidu生成视频的部分动图
Vidu能根据文本描述直接生成16秒高质量视频,且生成视频流畅连贯,没有明显的插帧现象。据介绍,这是因为Vidu采用的是“一步到位”的生成方式,与Sora一样,文本到视
联系作者
文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...