潞晨科技尤洋：如何用低成本做出类Sora？成功复现有四个要素，时空分割是关键一步｜GenAICon2024

AIGC动态2年前 (2024)发布智东西

AIGC动态欢迎阅读

原标题：潞晨科技尤洋：如何用低成本做出类Sora？成功复现有四个要素，时空分割是关键一步｜GenAICon2024
关键字：模型,视频,报告,解读,技术
文章来源：智东西
内容字数：14799字

内容摘要：

视频生成正处于“GPT-2时刻”，模型开源是有意义且重要的。
2024中国生成式AI大会于4月18-19日在北京举行，在大会第二天的主会场AI Infra专场上，新加坡国立大学校长青年教授、潞晨科技创始人兼董事长尤洋以《技术共享：类Sora开源架构模型与训练细节》为题发表演讲。
潞晨科技在今年3月开源的全球首个类Sora视频生成模型Open-Sora，是迄今GitHub上获得星标数最高的开源视频大模型项目之一，截至发稿前已有1.6万个星标，用户群体遍及全球。
值得一提的是，这个模型在低成本下训练而成。相比Sora耗费数千张H100 GPU、花费数千万美元乃至数亿美元，Open-Sora的训练成本仅不到1万美元。
尤洋认为，视频生成正处于“GPT-2时刻”，还没有出现成熟的应用。对于视频生成模型来说，数据可能是最核心的资产。他还谈到，模型开源是有意义且重要的。正如Meta最新发布的Llama 3，极大地调动了开源社区的积极性，不但造福大量开发者，更有助于开源社区整体的繁荣。
因此，Open-Sora模型也进行了全面的训练流程开源，开源了包括模型架构、模型权重、训练细节、数据处理在内的多项

原文链接：潞晨科技尤洋：如何用低成本做出类Sora？成功复现有四个要素，时空分割是关键一步｜GenAICon2024