4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX(英伟达40nm显卡)

AIGC动态欢迎阅读

原标题:4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

关键字:模型,华为,高效,图像,编码器

文章来源:新智元

内容字数:0字

内容摘要:

新智元报道编辑:桃子 好困

【新智元导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。

如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔!

正如其名字一样,Sana能以惊人速度合成高分辨率、高质量,且具有强文本-图像对其能力的模型。

而且,它还能高效生成高达4096×4096像素的图像。

项目主页:https://nvlabs.github.io/Sana/

论文地址:https://arxiv.org/abs/2410.10629

Sana的核心设计包含了以下几个要素:

深度压缩自编码器(AE):传统自编码器只能将图像压缩8倍,全新AE可将图像压缩32倍,有效减少了潜在token的数量。

线性DiT(Diffusion Transformer):用「线性注意力」替换了DiT中所有的普通注意力,在高分辨率下更加高效,且不会牺牲质量。

基于仅解码器模型的文本编码器:用现代的仅解码器S

原文链接:4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

联系作者

文章来源:新智元

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?