全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重

AIGC动态9个月前发布 量子位
16 0 0

全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重

AIGC动态欢迎阅读

原标题:全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
关键字:视频,模型,解读,数据,注意力
文章来源:量子位
内容字数:6648字

内容摘要:


明敏 发自 凹非寺量子位 | 公众号 QbitAI全球首个开源的类Sora架构视频生成模型,来了!
整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。
这就是刚刚发布的Open-Sora 1.0。
它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。
还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。
亦或是延时摄影下的浩瀚星空。
自Sora发布以来,由于效果惊艳但技术细节寥寥,揭秘、复现Sora成为了开发社区最热议话题之一。比如Colossal-AI团队推出成本直降46%的Sora训练推理复现流程。
短短两周时间后,该团队再次发布最新进展,复现类Sora方案,并将技术方案及详细上手教程在GitHub上免费开源。
那么问题来了,复现Sora如何实现?
Open-Sora 开源地址:https://github.com/hpcaitech/Open-Sora
全面解读Sora复现方案Sora复现方案包括四个方面:
模型架构设计
训练复现方案
数据预处理
高效训练优化策略
模型架构设计模型采用了Sora同源架构Diffusion Transformer (DiT) 。


原文链接:全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...