4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

AIGC动态欢迎阅读

原标题:4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX
关键字:模型,华为,高效,图像,编码器
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:桃子 好困
【新智元导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。
如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔!
正如其名字一样,Sana能以惊人速度合成高分辨率、高质量,且具有强文本-图像对其能力的模型。
而且,它还能高效生成高达4096×4096像素的图像。
项目主页:https://nvlabs.github.io/Sana/
论文地址:https://arxiv.org/abs/2410.10629
Sana的核心设计包含了以下几个要素:
深度压缩自编码器(AE):传统自编码器只能将图像压缩8倍,全新AE可将图像压缩32倍,有效减少了潜在token的数量。
线性DiT(Diffusion Transformer):用「线性注意力」替换了DiT中所有的普通注意力,在高分辨率下更加高效,且不会牺牲质量。
基于仅解码器模型的文本编码器:用现代的仅解码器S


原文链接:4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

联系作者

文章来源:新智元
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...