Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？
关键字：模型,文本,图像,作者,性能
文章来源：机器之心
内容字数：5724字

内容摘要：

机器之心报道
编辑：张倩在众多前沿成果都不再透露技术细节之际，Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了！
这个模型于两周前发布，采用了与 Sora 相同的 DiT（Diffusion Transformer）架构，一经发布就引起了不小的轰动。
与之前的版本相比，Stable Diffusion 3 生成的图在质量上实现了很大改进，支持多主题提示，文字书写效果也更好了（明显不再乱码）。Stability AI 表示，Stable Diffusion 3 是一个模型系列，参数量从 800M 到 8B 不等。这个参数量意味着，它可以在很多便携式设备上直接跑，大大降低了 AI 大模型的使用门槛。
在最新发布的论文中，Stability AI 表示，在基于人类偏好的评估中，Stable Diffusion 3 优于当前最先进的文本到图像生成系统，如 DALL・E 3、Midjourney v6 和 Ideogram v1。不久之后，他们将公开该研究的实验数据、代码和模型权重。在论文中，Stability AI 透露了关于

原文链接：Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？