中科院等万字详解：最前沿图像扩散模型综述

AIGC动态1年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：中科院等万字详解：最前沿图像扩散模型综述
关键字：模型,图像,方法,图像编辑,编辑
文章来源：量子位
内容字数：8294字

内容摘要：

黄健成投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型，中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。
全文长达26页，共1.5万余词，涵盖297篇文献，全面研究了图像编辑的各种前沿方法。
同时，作者还提出了全新的benchmark，为研究者提供了便捷的学习参考工具。
在这份综述中，作者从理论和实践层面，详尽总结了使用扩散模型进行图像编辑的现有方法。
作者从学习策略、输入条件等多个角度对相关成果进行分类，并展开了深入分析。
为了进一步评估模型性能，作者还提出了一个测评基准，并展望了未来研究的一些潜在方向。
△基于扩散模型的图像编辑成果速览下面，作者将从任务分类、实现方式、测试基准和未来展望四个方面介绍基于扩散模型的图像编辑成果。
图像编辑的分类除了在图像生成、恢复和增强方面取得的重大进步外，扩散模型在图像编辑方面也实现了显著突破，相比之前占主导地位的生成对抗网络（GANs），前者具有更强的可控性。
不同于“从零开始”的图像生成，以及旨在修复模糊图像、提高质量的图像恢复和增强，图像编辑涉及对现有图像外观、结构或内容的修改，包括添加对象、替换背景和改变纹理等任务

原文链接：中科院等万字详解：最前沿图像扩散模型综述