何恺明谢赛宁解剖扩散模型，新作刚刚出炉

AIGC动态2年前 (2024)发布量子位

何恺明谢赛宁解剖扩散模型，新作刚刚出炉

AIGC动态欢迎阅读

原标题：何恺明谢赛宁解剖扩散模型，新作刚刚出炉
关键字：模型,噪声,表示,损失,编码器
文章来源：量子位
内容字数：5727字

内容摘要：

编辑部发自凹非寺量子位 | 公众号 QbitAICV大神何恺明，也来搞扩散模型（Diffusion Model）了！
大神最新论文刚刚挂上arXiv，还是热乎的：解构扩散模型，提出一个高度简化的新架构l-DAE（小写的L）。
并且通过与何恺明在视觉自监督学习领域的代表作MAE（Masked Autoencoder）对比，更好地理解了扩散模型内部的工作原理。
不仅如此，这篇论文还发现在扩散模型中，去噪过程比扩散过程更重要。
这项工作阵容非常豪华，不仅有何恺明坐镇，合著作者中还有纽约大学计算机科学助理教授、CV大牛谢赛宁。
以及曾和他共同发表ConvNeXT工作的刘壮——他同时是DenseNet的共同一作。
给扩散模型开刀团队认为，尽管去噪扩散模型在生成任务上表现出色，但它们在表示学习方面的能力尚未得到充分探索。
为此，他们找到一个新颖的研究方法：
希望通过解构扩散模型，将其逐步转化为类似于MAE的架构，以更深入地理解其在自监督学习中的表示学习能力。
先来一图概括解构过程：
（如果你也觉得这个图很眼熟，没错，就是谢赛宁在代表作ConvNeXT中使用的同款。）
以使用了VQGAN tok

原文链接：何恺明谢赛宁解剖扩散模型，新作刚刚出炉