AIGC动态欢迎阅读
原标题:潞晨科技尤洋:如何用低成本做出类Sora?成功复现有四个要素,时空分割是关键一步|GenAICon2024
关键字:模型,视频,报告,解读,技术
文章来源:智东西
内容字数:14799字
内容摘要:
视频生成正处于“GPT-2时刻”,模型开源是有意义且重要的。
2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AI Infra专场上,新加坡国立大学校长青年教授、潞晨科技创始人兼董事长尤洋以《技术共享:类Sora开源架构模型与训练细节》为题发表演讲。
潞晨科技在今年3月开源的全球首个类Sora视频生成模型Open-Sora,是迄今GitHub上获得星标数最高的开源视频大模型项目之一,截至发稿前已有1.6万个星标,用户群体遍及全球。
值得一提的是,这个模型在低成本下训练而成。相比Sora耗费数千张H100 GPU、花费数千万美元乃至数亿美元,Open-Sora的训练成本仅不到1万美元。
尤洋认为,视频生成正处于“GPT-2时刻”,还没有出现成熟的应用。对于视频生成模型来说,数据可能是最核心的资产。他还谈到,模型开源是有意义且重要的。正如Meta最新发布的Llama 3,极大地调动了开源社区的积极性,不但造福大量开发者,更有助于开源社区整体的繁荣。
因此,Open-Sora模型也进行了全面的训练流程开源,开源了包括模型架构、模型权重、训练细节、数据处理在内的多项
原文链接:潞晨科技尤洋:如何用低成本做出类Sora?成功复现有四个要素,时空分割是关键一步|GenAICon2024
联系作者
文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...