AIGC动态欢迎阅读
原标题:Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂
关键字:视频,图像,文本,模型,智能
文章来源:新智元
内容字数:11999字
内容摘要:
新智元报道编辑:编辑部
【新智元导读】用不了多久,开源版的Sora就会涌来!理海大学微软团队已经做出一种全新多AI智能体框架Mora,可以完全复刻Sora能力,且生成视频效果几乎不相上下。微软版Sora诞生了!
Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。
尽管提出了Diffusion Transformer和空间patch策略,但想要达到Sora的性能还是很难,何况还缺乏算力和数据集。
不过,研究者发起的新一波复现Sora的冲锋,这不就来了么!
就在刚刚,理海大手微软团队一种新型的多AI智能体框架———Mora。
论文地址:https://arxiv.org/abs/2403.13248
没错,理海大学和微软的思路,是靠AI智能体。
Mora更像是Sora的通才视频生成。通过整合多个SOTA的视觉AI智能体,来复现Sora展示的通用视频生成能力。
具体来说,Mora能够利用多个视觉智能体,在多种任务中成功模拟Sora的视频生成能力,包括:
– 文本到视频生成
– 基于文本条件的图像到视频生成
– 扩展已生成视频
– 视频到视
原文链接:Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...