Stable Diffusion 3开源秒翻车,画人好掉san

AIGC动态3个月前发布 量子位
5 0 0

Stable Diffusion 3开源秒翻车,画人好掉san

AIGC动态欢迎阅读

原标题:Stable Diffusion 3开源秒翻车,画人好掉san
关键字:模型,翻车,版本,发现,问题
文章来源:量子位
内容字数:0字

内容摘要:


明敏 发自 凹非寺量子位 | 公众号 QbitAI没想到……Stable Diffusion 3开源即出现翻车案例。
生成一个躺在草地上的女孩,结果长这样?
而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。
(前方高能)
但如果是局部,比如只生成人脸,确实很nice。
清晰度、写字、写实性等方面都有明显提升。
对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。
那么问题来了,为啥偏偏画不好人类?
问题可能在于数据集先来看看SD3开源的具体情况。
本次开源的版本是Stable Diffusion 3 Medium(中杯)。
它的规模为20亿参数,在笔记本上就能跑了。
官方强调的属性有5方面,逐一来看:
整体质量和写实性
可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。
通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。
提示词理解
可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。
有效利用资源
对VRAM占用很低,非常适合在消费级GPU上运


原文链接:Stable Diffusion 3开源秒翻车,画人好掉san

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...