InvSR：高清修复老旧照片的开源超分辨率模型提升细节与清晰度

AI工具2年前 (2024)发布 AI工具集

InvSR是一款创新的图像超分辨率模型，它依托扩散模型的逆向过程，从低分辨率图像中恢复出高分辨率图像。通过利用大型预训练扩散模型所蕴含的丰富图像先验知识，InvSR显著提升了超分辨率的效果。核心技术是深度噪声预测器，它能够高效估算在正向扩散过程中所需的最佳噪声图，从而优化采样质量。

InvSR是什么

InvSR是一种先进的图像超分辨率模型，专门设计用于基于扩散模型的逆向过程，能够将低分辨率图像转化为高分辨率图像。该模型借助于大型预训练扩散模型中的图像先验，极大地改善了超分辨率的效果。InvSR的核心在于其深度噪声预测器，该预测器可以精确估计在正向扩散过程中的最佳噪声图。这种方法充分利用了扩散模型的先验知识，提供了灵活且高效的采样机制，允许用户根据图像退化的特征或具体需求调整采样步骤。

InvSR的主要功能

图像超分辨率提升：主要功能是将低分辨率图像恢复为高分辨率图像。
灵活的采样机制：支持从一到五个不同数量的采样步骤，用户可以根据图像退化的类型或特定需求自行调整。
噪声预测：深度噪声预测器提供最佳噪声图的估算，作为初始化扩散模型采样的基础。
扩散模型的充分利用：有效利用预训练扩散模型中的图像先验，显著提升超分辨率性能。
高效计算：即使在减少采样步骤的情况下，仍能保持并超越现有方法的性能，提高计算效率。

InvSR的技术原理

扩散模型框架：基于扩散模型（如Denoising Diffusion Probabilistic Model， DDPM），逐步添加噪声将高分辨率图像转化为随机噪声图。
部分噪声预测策略：构建扩散模型的中间状态作为起始点，简化从低分辨率到高分辨率的反向过程。
深度噪声预测器：核心组件之一，估计正向扩散过程中的最佳噪声图，从而优化采样过程。
逆向扩散过程：从噪声图开始，通过逆向扩散的方式逐步去除噪声，最终恢复出高分辨率图像。
灵活的采样步骤：用户可以选择不同的起始采样点，结合现有采样算法，适应不同的图像退化情况。
训练与优化：通过最小化预测高分辨率图像与真实图像之间的差异，利用L2损失、LPIPS损失和GAN损失对噪声预测器进行训练，以优化性能。