使用生成对抗网络(GAN)进行图像超分辨率(SR)已经在恢复逼真细节方面取得了巨大成功。然而,众所周知,基于 GAN 的 SR 模型会产生令人难以接受的伪影,特别是在实际场景中。以往的研究通常在训练阶段通过额外的损失惩罚来抑制瑕疵,但这些方法只适用于训练过程中生成的同分布下的瑕疵类型。而当这些方法应用于真实世界场景中时,我们观察到这些方法在推理过程中仍然会产生明显的瑕疵。针对此,来自腾讯 ARC Lab,XPixel 团队和澳门大学的研究者们提出了 DeSRA 的新方法并发表论文。它能够对在推理阶段中产生的超分瑕疵进行检测并消除。该论文被 ICML 2023 所接收。 “GAN 训练时出现的瑕疵” 与 “GAN 推理时出现的瑕疵” 基于 GAN 的方法在生成带有纹理的逼真复原结果方面取得了巨大成功。BSRGAN [1] 和 Real-ESRGAN [2] 将基于 GAN 的模型扩展到了真实场景应用,展示了它们恢复真实世界图像纹理的能力。然而, GAN-SR 方法经常会生成令人视觉上难以接受的伪影,严重影响用户体验。这个问题在真实世界场景中更加严重,因为低分辨率图像的退化是未知且复杂的。
第一列:低清输入;第二列:现有超分方法引起瑕疵;第三列:DeSRA 检测出瑕疵区域;第四列:DeSRA 去除瑕疵
为了缓解瑕疵的生成,LDL [3] 通过分析纹理类型,计算每个像素是瑕疵的概率,并在训练过程中通过增加损失进而对瑕疵进行抑制。虽然它确实改善了 GAN-SR 的结果,但我们仍然可以观察到 LDL 在推理真实世界测试数据时会存在明显瑕疵,如上图所示。因此,仅仅通过改善模型的训练很难解决这些瑕疵问题,因为这些瑕疵在 GAN-SR 模型的训练过程中可能并不出现。 这里我们区分一下 GAN 训练出现的瑕疵和测试出现的瑕疵:
- GAN 训练出现的瑕疵(GAN-training artifacts):出现在训练阶段,主要是由于训练时网络优化的不稳定和在同分布数据上的 SR 的 ill-pose 导致。在有干净的高清图像存在的情况下,可以在训练过程中对这些瑕疵加以约束,进而缓解瑕疵的生成,如 LDL [3]。
- GAN 推理出现的瑕疵(GAN-inference artifacts):出现在推理阶段,这些伪影通常是在真实世界未见过的数据中出现的。这些瑕疵通常不在训练数据的分布中,并不会在训练阶段出现。因此,通过改善训练过程的方法(例如 LDL [3])无法解决这些瑕疵问题。
- 这些瑕疵不会出现在预训练的 MSE-SR 模型中。
- 这些瑕疵很明显且面积较大,能够很容易被人眼捕捉到。上图展示了一些包含这些瑕疵的样例。
- 局部纹理复杂性:局部区域 P 内像素强度的标准差 σ(i, j) 来表示局部纹理
- 绝对纹理差异 d:两个局部区域的标准差(x 表示 GAN-SR 区域,y 表示 MSE-SR 区域)
- 相对纹理差异 d’:
- 归一化到 [0, 1]:
- 引入一个常数 C:处理分母相对较小的情况
由于缺乏真实世界低分辨率数据的高清参考图片,经典指标如 PSNR、SSIM 无法采用。因此,研究团队考虑三个指标来评估检测结果,包括 1) 检测到的瑕疵区域与实际的(人工标注的)瑕疵区域之间的交并比(IoU),2) 检测结果的精确度和 3) 检测结果的召回率。当用 A 和 B 表示特定区域 z 的检测到的瑕疵区域和实际的瑕疵区域时,IoU 定义为:
计算每个图像的 IoU,并使用验证集上的平均 IoU 来评估检测算法。较高的 IoU 意味着更好的检测准确性。然后,我们将检测到的瑕疵区域集合定义为 S,正确样本集合 T 定义为:
精确度 =表示正确检测的区域数()占总检测到的区域数()的比例。
研究团队将实际的瑕疵区域定义为 G,并通过以下方式计算检测到的 GT 瑕疵区域集合 R: 召回率 =表示正确检测到的 GT 瑕疵区域数()占总 GT 瑕疵区域数()的比例。其中,p 是一个阈值,研究团队根据经验将其设置为 0.5。
瑕疵检测结果 如下表所示,针对 LDL 模型中的瑕疵检测结果中,本文方法获得了最好的 IoU 和 Precision,远远超过其他方案。需要注意的是,LDL 在 threshold=0.001 时获得了最高的召回率。这是因为该方案将大部分区域视为瑕疵,因此这种检测结果几乎没有意义。Real-ESRGAN 和 SwinIR 的结果可以参考原文。 研究团队同时对比了使用 DeSRA 微调策略之前和之后的瑕疵检测结果,结果如下表所示,当应用他们的 DeSRA 之后,Real-ESRGAN 的 IoU 从 51.1 降至 12.9,LDL 的 IoU 从 44.5 降至 13.9,说明瑕疵区域的检测面积大大减少。去除率分别为 75.43% 和 74.97%,表明在微调之后,测试数据中四分之三的瑕疵可以完全消除。此外,他们的方法没有引入额外瑕疵,添加率为 0。 本文在下图中提供了使用与未使用该文方法改进 GAN-SR 模型的结果的视觉比较。与原始的模型结果相比,改进的 GAN-SR 模型生成的结果在视觉质量上更好,没有明显的 GAN-SR 瑕疵。所有这些实验结果证明了本文方法能有效的缓解模型在处理真实的低清图片时会出现的瑕疵。 User Study 为了进一步验证本文 DeSRA 微调策略的有效性,研究团队进行了两项用户研究。第一项是比较原始 GAN-SR 模型和微调后的 GAN-SR 模型生成的结果。对于这个实验,比较的重心是图片中是否存在明显的伪影。研究团队产生了共 20 组图像,每组包含 GAN-SR 模型和微调后的 GAN-SR 模型的输出结果。这些图像被随机打乱。共有 15 人参与了用户研究,并为每组选择他们认为伪影较少的图像。最终的统计结果如图 9 所示。82.23% 的参与者认为微调后的 GAN-SR 模型生成的结果较少存在伪影。可以看出,本文方法在很大程度上消除了原始模型产生的瑕疵。 第二项是对微调的 GAN-SR 模型和原始的 MSE-SR 模型结果的比较。这个实验是为了比较模型生成的结果是否有更多的细节。研究团队总共产生了 20 组图像,每组图像包含了 MSE-SR 模型和微调的 GAN-SR 模型的输出结果。这些图像被随机打乱。总共有 15 个人参加用户研究,并为每组选择他们认为有更多细节的图像。最终的统计结果如图 9 所示。93% 的参与者认为微调的 GAN-SR 模型生成的结果有着更多的细节。可以看出,微调的 GAN-SR 模型仍然比 MSE-SR 模型能够生成更多的细节。 结论 在这项工作中,研究团队分析了 GAN 在推理阶段引入的瑕疵,并提出了方法来检测和消除这些瑕疵。具体而言,他们首先计算了 MSE-SR 和 GAN-SR 的相对局部方差,并进一步结合语义信息来定位有瑕疵的区域。在检测到存在瑕疵的区域后,他们使用基于 MSE 的结果作为伪高清图片来微调模型。通过仅使用少量数据,微调的模型可以成功消除原始模型在推理过程中的瑕疵。实验结果显示了他们的方法在检测和去除瑕疵方面的优越性,并且显著提高了 GAN-SR 模型在实际应用中的能力。 在线持续学习 本文方法可以与持续学习相结合,从而提供一个新的范式来解决在线推理阶段中出现的瑕疵问题。例如,对于处理真实世界数据的在线超分辨率系统,可以使用研究团队的检测流程来检测复原的结果是否具有 GAN-inference 瑕疵。然后,他们可以使用检测到的带有瑕疵的图像快速对超分辨率模型进行微调,使其能够处理类似的瑕疵,直到系统遇到新的 GAN-inference 瑕疵。持续学习已经在高层视觉任务上得到广泛研究,但尚未应用于超分辨率。研究团队希望在未来研究这个问题,因为它可以极大地推进 GAN-SR 方法在实际场景中的应用。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
物联网
+关注
关注
2900文章
43994浏览量
369867
原文标题:检测并消除瑕疵,DeSRA让真实场景超分中的GAN更加完美
文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
优可测超景深数码显微镜AH-3000系列 产品手册
优可测超景深显微镜:可进行360°无死角高像素高清观察;应用于各行各业的瑕疵检测、材料分析、失效分析、三维检测等;一台机器同时替代体式、金相、工具显微镜等,达到成本于效率的最大化。
发表于 09-25 14:06
•0次下载
利用TI GaN中的集成电流检测功能更大限度提高系统效率
电子发烧友网站提供《利用TI GaN中的集成电流检测功能更大限度提高系统效率.pdf》资料免费下载
发表于 08-29 11:28
•0次下载
单北斗定位终端的优势在哪些场景下更加凸显
单北斗定位终端以其高精度、实时性、广泛覆盖及自主可控等优势,在应急救援、特种行业作业、危险环境监控、物流追踪及精准农业等场景下更加凸显其价值。在这些复杂多变的应用环境中,单北斗定位终端不仅确保了定位
GaN晶体管的应用场景有哪些
GaN(氮化镓)晶体管,特别是GaN HEMT(高电子迁移率晶体管),近年来在多个领域展现出广泛的应用场景。其出色的高频性能、高功率密度、高温稳定性以及低导通电阻等特性,使得GaN晶体
深圳恒兴隆|制造业的新星:高光超精电主轴的崛起...
的多样化,高光超精电主轴将更加注重定制化服务,满足不同客户的个性化需求。
综上所述,高光超精电主轴作为精密制造领域的重要装备之一,其高精度、高稳定性和高效率的特点使其成为制造业中不可
发表于 05-13 09:55
会议平板:让远程会议更真实、更生动
会议平板:让远程会议更真实、更生动 在数字化时代,远程会议已经成为企业日常沟通的重要方式。然而,传统的远程会议方式往往因为沟通障碍、信息传递不全等问题,使得参会者难以获得真实的交流体验。如今,随着
赛默斐视表面瑕疵检测系统是一种利用机器视觉技术
表面瑕疵检测系统是一种利用机器视觉技术来检测产品表面瑕疵的系统。它可以自动地对产品的表面进行检测,识别出可能存在的缺陷、污渍、划痕等问题。
描绘未知:数据缺乏场景的缺陷检测方案
Neuro-T 视觉平台 克服了数据缺乏状况的困难,通过零代码设置 GAN模型 和 无监督学习模型 ,轻松实现缺陷图像的标注、绘制和导出。 工业应用中存在较多的缺陷检测需求。针对缺陷检测
怎么消除电阻分压(没有电压跟随器)带来的误差
怎么消除电阻分压(没有电压跟随器)带来的误差 消除电阻分压带来的误差是一个重要的问题,特别是在需要准确测量电压的应用中。电阻
想要玩转氮化镓?纳芯微全场景GaN驱动IC解决方案来啦!
作为当下热门的第三代半导体技术,GaN在数据中心、光伏、储能、电动汽车等市场都有着广阔的应用场景。和传统的Si器件相比,GaN具有 更高的开关频率 与 更小的开关损耗 ,但对驱动IC与驱动电路设计也
超分画质大模型!华为和清华联合提出CoSeR:基于认知的万物超分大模型
一是缺乏泛化能力。为了实现更好的超分效果,通常需要针对特定场景使用特定传感器采集到的数据来进行模型训练,这种学习方式拟合了某种低清图像和高清图像间的映射,但在其他场景下表现不佳。此外,
评论