Side Window Filtering 论文解读和C++实现-电子发烧友网

本文复现的是CVPR2019 Oral论文Side Window Filtering。
作者：梁德澎
首发知乎：https://zhuanlan.zhihu.com/p/79254846

论文：Side Window Filtering（文末可以直接下载）
链接：https://arxiv.org/pdf/1905.07177.pdf

刚开始看到这篇论文的时候，我就很感兴趣想去复现一把看看效果。这篇论文是 CVPR2019 oral 且不是深度学习方向的，其核心贡献点就是：不管原来的滤波器保不保边，运用了side-window思想之后，都可以让它变成保边滤波！

于是利用业余时间，参考作者开源的matlab代码，我用C++实现了一下Side-window 盒子滤波，其他滤波器有时间再试下，下面是github的链接，读者可以去跑下代码看看效果玩下，从实验结果上看我觉得算是复现了论文的效果：

side window 盒子滤波C++复现代码：
side window 中值滤波C++复现代码

我们来看下复现论文的效果，对于一张普通图片，经典的盒子滤波和side-window 盒子滤波的效果对比：

从滤波结果对比上可以看到，经典的盒子滤波随着对同一张图片反复应用盒子滤波的迭代次数的增加，视觉效果是越来越模糊，到了30次迭代的时候已经糊的没法看了，但是Side-window盒子滤波即使迭代了30次，对于边缘的保持还很好，和原图基本看不出大的区别，就是边缘细节有些丢失。

然后对原图加上椒盐噪声，再对比下滤波效果：

从滤波结果对比上可以看到，经典的盒子滤波到了10次迭代的时候，虽然椒盐噪声已经很好的消除了，但是图片也变得很模糊，边缘都细节都丢失了，但是Side-window盒子滤波却能很好的消除椒盐噪声的同时，对于边缘的保持还很好，基本上算是还原了原图。

下面从我的理解上去简单解读下这篇论文的核心思想，还有我在复现过程中的一些实现细节介绍。

目前的经典滤波算法基本都是，以某个像素点为中心，按照滤波半径，把这个包括像素点和其邻域加权线性组合得到输出，一般公式如下：

Ω是以像素点 i 为中心的滤波窗口，w是滤波权值，q是原图像素值，I'是输出结果。但是这样以一个像素为中心去滤波会导致的问题是，如果一个像素点处在边缘位置（这里的边缘不是指图片的大小边界，而是指图像中物体的边缘）的话，以像素为中心去滤波会导致滤波结果的边缘部分变模糊。具体是为什么，论文中给出了分析过程。

首先来看下，论文中的一张图：

文中提到为了分析方便只讨论3种典型的边缘，分别是图中的 (a)阶梯状边缘、(b)斜坡状边缘和(c)屋顶状边缘。论文中也给出了这3三种边缘的形象展示：

然后文中采用了泰勒展开去分析，首先假定，图像上(x, y)坐标点的像素值为g(x, y)，对于图中展示的情况来看，函数 g(x, y)是连续但不可导的。对于(a)阶梯状边缘的 'a' (蓝色方框那个点)点来说，文中定义 'a-' 和 'a+' 来分别表示 'a' 点左极限 (x - ε, y)，和右极限 (x + ε, y)，且 ε > 0。很明显从图中可以看出来 g(x - ε, y) ≠ g(x + ε, y) 且/或（文中的用词是"and (or)"）g'(x - ε, y) ≠ g'(x + ε, y)，导数也不等是由于边缘部分的跳跃。因此对于这两块区域的泰勒展开也是不一样的，首先来看下泰勒展开的一般公式：

“泰勒公式是将一个在 x=x0 处具有n阶导数的函数 f(x) 利用关于 (x - x0) 的n次多项式来逼近函数的方法。”----百度百科

根据文中的分析，这里设定 f(x) = g(x - 2ε, y)，x0 = x - ε，则根据泰勒展开公式：

g(x - 2ε, y) ≈ f(x0) + f'(x0)(x - x0)
= g(x - ε, y) + g'(x - ε, y)(x - 2ε - (x - ε))
= g(x - ε, y) + g'(x - ε, y)(- ε)

同理，设 f(x) = g(x + 2ε, y)，x0 = x + ε，则泰勒展开得：

g(x + 2ε, y) ≈ f(x0) + f'(x0)(x - x0)
= g(x + ε, y) + g'(x + ε, y)(x + 2ε - (x + ε))
= g(x + ε, y) + g'(x + ε, y)ε

所以从两边的泰勒展开式可以得出结论，对于 'a-' 区域的滤波估计肯定是来自区域 'a' 的左边，而对于 'a+' 估计是来自于 'a' 的右边，然后类比分析区域 'b'，'c' 和 'd' 都可以得到类似的结论。

因此分析得到的结论是，如果一个像素点处于图像中的边缘位置，那么滤波的时候就应该把滤波器的边缘和该像素点对齐，而不是把滤波器的中心和该像素点对齐。受该发现的启发，文中提出了一个新的保边滤波策略，就是把每个滤波像素点都当成是潜在的边缘点，然后对于每个待滤波的像素点，生成几种不同的滤波子窗口，然后把这些滤波窗口的边缘或者角点位置和该像素点对齐，然后滤波得到结果，最后根据把这些子窗口的滤波之后的最佳重构结果作为最终的滤波结果。以上就是side window 滤波的思想。

然后文中提出了8个方向的滤波窗口，分别是上、下，左、右、左上、右上、左下和右下，最后就得到了 side window filter 的核心算法流程：

其实从核心算法逻辑来看，对原来滤波算法的改动其实不大，就是滤波的窗口位置和大小需要改动下，然后把8次的结果每个位置取重构误差最小的。然后论文中又详细分析了 box filter 和 side window box filter 对于上面提到的三种经典边缘的滤波之后的保留情况。文中给出分析的图表如下：

总的来说结论就是 side window box filter 对于阶梯和斜坡状的边缘都能完整的保留，而对于屋顶状边缘虽然不能完整的保留边缘，但是也比经典的盒子滤波要好很多。

在复现过程中，本来一开始是想对文中提到的8种side window去分别写对应的盒子滤波的，因为盒子滤波有个经典的优化思路，可以让运行时间不受滤波半径的影响，具体可以参考我之前写得一篇博客：

梁德澎：移动端arm cpu优化学习笔记----一步步优化盒子滤波（Box Filter）

后来仔细想了下，这8个side window其实也就是边界处理不同，核心运算逻辑都是一致的，最后就是抽象成一个函数，对于不同的side window传不同的边界参数，就不需要每个窗口写一个函数了，具体可以看看github上的代码。

然后在实现side window中值滤波的时候针对移动端想了一个加速方案，因为求中值需要对窗口内元素排序，这里直观上感觉是没什么办法加速的，不过我尝试了一个方案，利用neon指令相对原来提速了不少，有空的话可以写一篇小博客去解释，这里先埋一个彩蛋。

最后看看几组对比结果，看看在迭代10次的情况下，经典box filter 和 side window box filter的结果对比：

熊猫宝宝原图

滤波结果, box filter, iteration = 10

滤波结果, side window box filter, iteration = 10

熊猫宝宝原图+椒盐噪声

去噪结果, box filter, iteration = 10

去噪结果, side window box filter, iteration = 10

然后在迭代10次的情况下，经典中值 filter 和 side window 中值滤波的结果对比：

歼20+椒盐噪声

去噪结果, median filter, iteration = 10

去噪结果, side window median filter, iteration = 10

相关资料：

AI鸡蛋：CVPR2019 Oral论文 #5176 Side Window Filtering介绍
AI鸡蛋：Sub-window Box Filter论文介绍

推荐文章

移动端arm cpu优化学习笔记（一）——一步步优化盒子滤波（Box Filter）
移动端arm cpu优化学习笔记第2弹--常量阶时间复杂度中值滤波

更多AI移动端优化的请关注专栏嵌入式AI以及知乎（@梁德澎）。

审核编辑：符乾江

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
32360

浏览量
271452
人工智能

人工智能

+关注

关注
1799

文章
48059

浏览量
241977

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Side Window Filtering 论文解读和C++实现

评论

Spire.XLS for C++组件说明

EE-112:模拟C++中的类实现

运动控制卡周期上报实时数据IO状态之C++篇

ADS1299EEGFE-PDK在window上如何通过C++读取8通道数据？

C语言和C++中结构体的区别

C7000优化C/C++编译器

所有Window Watchdog Supervisors

ostream在c++中的用法

OpenVINO2024 C++推理使用技巧

C++语言基础知识

C++中实现类似instanceof的方法

Perforce静态代码分析专家解读MISRA C++：2023®新标准：如何安全、高效地使用基于范围的for循环，防范未定义行

C/C++中两种宏实现方式

鸿蒙OS开发实例：【Native C++】

使用 MISRA C++：2023® 避免基于范围的 for 循环中的错误