AIGC动态欢迎阅读
原标题:Sora 在英伟达 H100 上生成 1 分钟视频约需 12 分钟
关键字:报告,视频,模型,数据,图像
文章来源:AI范儿
内容字数:3771字
内容摘要:
点击上方蓝字关注我们“Sora模型的成本:
Sora的训练需要大量的计算资源,估计需要4211-10528个 Nvidia H100 GPUs运行一个月。
推理成本:一个Nvidia H100 GPU大约每小时能生成5分钟的视频。
初期的Sora成本将非常高,肯定是不适合普通人来使用,所以目前OpenAI都是先找一些艺术和电影工作室或者公司合作。我们尝试从 DiT 模型的训练细节推断 Sora 的训练计算量。DiT-XL 模型拥有 6.75亿 参数,其训练总计算量约为 10^21 FLOPS。简单来说,这相当于使用 0.4 台 Nvidia H100 计算一个月,或者一台 H100 计算 12 天。
尽管 DiT 仅处理图像,而 Sora 则是视频模型,能够生成长达 1 分钟的视频。假设视频以 24fps 编码,那么一个视频最多包含 1,440 帧。如果按照 DiT 论文中的压缩率(8x)计算,Sora 在潜在空间中可能只处理 180 帧。这意味着,如果我们简单地将 DiT 的计算量外推到视频,计算量将增加 180 倍。
我们估计 Sora 的参数量可能远远超过 6.75亿,可能达到
原文链接:Sora 在英伟达 H100 上生成 1 分钟视频约需 12 分钟
联系作者
文章来源:AI范儿
作者微信:AI_Insights
作者简介:AI领域四大媒体之一。 智能未来,始于Prompt!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...