Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂
关键字：视频,图像,文本,模型,智能
文章来源：新智元
内容字数：11999字

内容摘要：

新智元报道编辑：编辑部
【新智元导读】用不了多久，开源版的Sora就会涌来！理海大学微软团队已经做出一种全新多AI智能体框架Mora，可以完全复刻Sora能力，且生成视频效果几乎不相上下。微软版Sora诞生了！
Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。
尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集。
不过，研究者发起的新一波复现Sora的冲锋，这不就来了么！
就在刚刚，理海大手微软团队一种新型的多AI智能体框架———Mora。
论文地址：https://arxiv.org/abs/2403.13248
没错，理海大学和微软的思路，是靠AI智能体。
Mora更像是Sora的通才视频生成。通过整合多个SOTA的视觉AI智能体，来复现Sora展示的通用视频生成能力。
具体来说，Mora能够利用多个视觉智能体，在多种任务中成功模拟Sora的视频生成能力，包括：
– 文本到视频生成
– 基于文本条件的图像到视频生成
– 扩展已生成视频
– 视频到视

原文链接：Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

联系作者

文章来源：新智元
作者微信：AI_era
作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人对人类社会与文明进化的影响，领航中国新智能时代。

阅读原文

# AIGC动态 # 图像 # 文本 # 智能 # 模型 # 视频

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

AIGC动态欢迎阅读

内容摘要：

联系作者

一口气读完《沙丘》，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V

Reddit IPO首日大涨48%，社交媒体卖用户数据第一股，股民追捧但Altman投资却差点亏本

相关文章

暂无评论

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

AIGC动态欢迎阅读

内容摘要：

联系作者

一口气读完《沙丘》 ，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V

Reddit IPO首日大涨48%，社交媒体卖用户数据第一股，股民追捧但Altman投资却差点亏本

相关文章

暂无评论

一口气读完《沙丘》，零一万物宝藏API正式开箱！酷炫Demo实测，多模态中文图表体验超越GPT-4V