Stable Diffusion 3开源秒翻车，画人好掉san（本地部署方式）

原标题：Stable Diffusion 3开源秒翻车

，画人好掉san

关键字：模型,翻车,版本,发现,问题

文章来源：量子位

内容字数：0字

明敏发自凹非寺量子位 | 公众号 QbitAI没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩，结果长这样？

而且不是个例，只要是和人（整体）相关的内容，生成结果都有点掉san。

（前方高能）

但如果是局部，比如只生成人脸，确实很nice。

清晰度、写字、写实性等方面都有明显提升。

对于复杂长提示词的理解也很到位，有网友发现提示越长它画的越好。

那么问题来了，为啥偏偏画不好人类？

问题可能在于数据集先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium（中杯）。

它的规模为20亿参数，在笔记本上就能跑了。

官方强调的属性有5方面，逐一来看：

整体质量和写实性

可生成出色的细节，包括色彩、光线、强写实等，带来灵活风格的高质量输出。

通过16通道VAE，成功解决了其他模型的常见缺陷，比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示，包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用，方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低，非常适合在消费级GPU上运

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破