AIGC动态欢迎阅读
原标题:比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
关键字:模型,掩蔽,图像,性能,作者
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:alan
【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?
之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。
大模型时代,一般人根本玩不起。想要各种文生小姐姐,还得靠厂商们负重前行
为了降低这庞大的开销,研究者们尝试了各种方案。
比如,原始的扩散模型从噪声到图像大约需要1000步,目前已经被减少到20步左右,甚至更少。
当扩散模型中的基础模块逐渐由Unet(CNN)替换为DiT(Transformer)之后,一些根据Transformer特性来做的优化也跟了上来。
比如量化,比如跳过Attention中的一些冗余计算,比如pipeline。
而近日,来自加州大学尔湾分校等机构的研究人员,把「省钱」这个目标直接向前推进了一大步:
论文地址:https://arxiv.org/abs/2407.15811
——从头开始训练一个11.6亿参数的扩散模型,只需要1890美元!
对比SOT
原文链接:比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
联系作者
文章来源:新智元
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...