Stable Diffusion 3开源秒翻车,画人好掉san(本地部署方式)

AIGC动态欢迎阅读

原标题:Stable Diffusion 3开源秒翻车

,画人好掉san

关键字:模型,翻车,版本,发现,问题

文章来源:量子位

内容字数:0字

内容摘要:

明敏 发自 凹非寺量子位 | 公众号 QbitAI没想到……Stable Diffusion 3开源即出现翻车案例。

生成一个躺在草地上的女孩,结果长这样?

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

(前方高能)

但如果是局部,比如只生成人脸,确实很nice。

清晰度、写字、写实性等方面都有明显提升。

对于复杂长提示词的理解也很到位,有网友发现提示越长它画的越好。

那么问题来了,为啥偏偏画不好人类?

问题可能在于数据集先来看看SD3开源的具体情况。

本次开源的版本是Stable Diffusion 3 Medium(中杯)。

它的规模为20亿参数,在笔记本上就能跑了。

官方强调的属性有5方面,逐一来看:

整体质量和写实性

可生成出色的细节,包括色彩、光线、强写实等,带来灵活风格的高质量输出。

通过16通道VAE,成功解决了其他模型的常见缺陷,比如手部和面部的写实问题。

提示词理解

可以理解复杂长提示,包含空间推理、元素组合、动作、风格等。3个文本编码器可以全部或者组合使用,方便用户平衡性能和显存。

有效利用资源

对VRAM占用很低,非常适合在消费级GPU上运

原文链接:Stable Diffusion 3开源秒翻车,画人好掉san

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?