何恺明谢赛宁解剖扩散模型,新作刚刚出炉

AIGC动态8个月前发布 量子位
25 0 0

何恺明谢赛宁解剖扩散模型,新作刚刚出炉

AIGC动态欢迎阅读

原标题:何恺明谢赛宁解剖扩散模型,新作刚刚出炉
关键字:模型,噪声,表示,损失,编码器
文章来源:量子位
内容字数:5727字

内容摘要:


编辑部 发自 凹非寺量子位 | 公众号 QbitAICV大神何恺明,也来搞扩散模型(Diffusion Model)了!
大神最新论文刚刚挂上arXiv,还是热乎的:解构扩散模型,提出一个高度简化的新架构l-DAE(小写的L)。
并且通过与何恺明在视觉自监督学习领域的代表作MAE(Masked Autoencoder)对比,更好地理解了扩散模型内部的工作原理。
不仅如此,这篇论文还发现在扩散模型中,去噪过程比扩散过程更重要。
这项工作阵容非常豪华,不仅有何恺明坐镇,合著作者中还有纽约大学计算机科学助理教授、CV大牛谢赛宁。
以及曾和他共同发表ConvNeXT工作的刘壮——他同时是DenseNet的共同一作。
给扩散模型开刀团队认为,尽管去噪扩散模型在生成任务上表现出色,但它们在表示学习方面的能力尚未得到充分探索。
为此,他们找到一个新颖的研究方法:
希望通过解构扩散模型,将其逐步转化为类似于MAE的架构,以更深入地理解其在自监督学习中的表示学习能力。
先来一图概括解构过程:
(如果你也觉得这个图很眼熟,没错,就是谢赛宁在代表作ConvNeXT中使用的同款。)
以使用了VQGAN tok


原文链接:何恺明谢赛宁解剖扩散模型,新作刚刚出炉

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...