Stable Diffusion 3开源秒翻车，画人好掉san

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：Stable Diffusion 3开源秒翻车，画人好掉san
关键字：模型,翻车,版本,发现,问题
文章来源：量子位
内容字数：0字

内容摘要：

明敏发自凹非寺量子位 | 公众号 QbitAI没想到……Stable Diffusion 3开源即出现翻车案例。
生成一个躺在草地上的女孩，结果长这样？
而且不是个例，只要是和人（整体）相关的内容，生成结果都有点掉san。
（前方高能）
但如果是局部，比如只生脸，确实很nice。
清晰度、写字、写实性等方面都有明显提升。
对于复杂长提示词的理解也很到位，有网友发现提示越长它画的越好。
那么问题来了，为啥偏偏画不好人类？
问题可能在于数据集先来看看SD3开源的具体情况。
本次开源的版本是Stable Diffusion 3 Medium（中杯）。
它的规模为20亿参数，在笔记本上就能跑了。
官方强调的属性有5方面，逐一来看：
整体质量和写实性
可生成出色的细节，包括色彩、光线、强写实等，带来灵活风格的高质量输出。
通过16通道VAE，成功解决了其他模型的常见缺陷，比如手部和面部的写实问题。
提示词理解
可以理解复杂长提示，包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用，方便用户平衡性能和显存。
有效利用资源
对VRAM占用很低，非常适合在消费级GPU上运