OpenCV使用深度学习做边缘检测的流程-电子发烧友网

导读

分析了Canny的优劣，并给出了OpenCV使用深度学习做边缘检测的流程。

在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的边缘检测，它比目前流行的canny边缘检测器更精确。边缘检测在许多用例中是有用的，如视觉显著性检测，目标检测，跟踪和运动分析，结构从运动，3D重建，自动驾驶，图像到文本分析等等。

什么是边缘检测？

边缘检测是计算机视觉中一个非常古老的问题，它涉及到检测图像中的边缘来确定目标的边界，从而分离感兴趣的目标。最流行的边缘检测技术之一是Canny边缘检测，它已经成为大多数计算机视觉研究人员和实践者的首选方法。让我们快速看一下Canny边缘检测。

Canny边缘检测算法

1983年，John Canny在麻省理工学院发明了Canny边缘检测。它将边缘检测视为一个信号处理问题。其核心思想是，如果你观察图像中每个像素的强度变化，它在边缘的时候非常高。

在下面这张简单的图片中，强度变化只发生在边界上。所以，你可以很容易地通过观察像素强度的变化来识别边缘。

现在，看下这张图片。强度不是恒定的，但强度的变化率在边缘处最高。（微积分复习：变化率可以用一阶导数（梯度）来计算。）

Canny边缘检测器通过4步来识别边缘：

去噪：因为这种方法依赖于强度的突然变化，如果图像有很多随机噪声，那么会将噪声作为边缘。所以，使用5×5的高斯滤波器平滑你的图像是一个非常好的主意。

梯度计算：下一步，我们计算图像中每个像素的强度的梯度（强度变化率）。我们也计算梯度的方向。

梯度方向垂直于边缘，它被映射到四个方向中的一个（水平、垂直和两个对角线方向）。

非极大值抑制：现在，我们想删除不是边缘的像素（设置它们的值为0）。你可能会说，我们可以简单地选取梯度值最高的像素，这些就是我们的边。然而，在真实的图像中，梯度不是简单地在只一个像素处达到峰值，而是在临近边缘的像素处都非常高。因此我们在梯度方向上取3×3附近的局部最大值。

迟滞阈值化：在下一步中，我们需要决定一个梯度的阈值，低于这个阈值所有的像素都将被抑制（设置为0）。而Canny边缘检测器则采用迟滞阈值法。迟滞阈值法是一种非常简单而有效的方法。我们使用两个阈值来代替只用一个阈值：

高阈值 = 选择一个非常高的值，这样任何梯度值高于这个值的像素都肯定是一个边缘。

低阈值 = 选择一个非常低的值，任何梯度值低于该值的像素绝对不是边缘。

在这两个阈值之间有梯度的像素会被检查，如果它们和边缘相连，就会留下，否则就会去掉。

迟滞阈值化

Canny 边缘检测的问题：

由于Canny边缘检测器只关注局部变化，没有语义（理解图像的内容）理解，精度有限（很多时候是这样）。

Canny边缘检测器在这种情况下会失败，因为没有理解图像的上下文

语义理解对于边缘检测是至关重要的，这就是为什么使用机器学习或深度学习的基于学习的检测器比canny边缘检测器产生更好的结果。

OpenCV中基于深度学习的边缘检测

OpenCV在其全新的DNN模块中集成了基于深度学习的边缘检测技术。你需要OpenCV 3.4.3或更高版本。这种技术被称为整体嵌套边缘检测或HED，是一种基于学习的端到端边缘检测系统，使用修剪过的类似vgg的卷积神经网络进行图像到图像的预测任务。

HED利用了中间层的输出。之前的层的输出称为side output，将所有5个卷积层的输出进行融合，生成最终的预测。由于在每一层生成的特征图大小不同，它可以有效地以不同的尺度查看图像。

网络结构：整体嵌套边缘检测

HED方法不仅比其他基于深度学习的方法更准确，而且速度也比其他方法快得多。这就是为什么OpenCV决定将其集成到新的DNN模块中。以下是这篇论文的结果：

在OpenCV中训练深度学习边缘检测的代码

OpenCV使用的预训练模型已经在Caffe框架中训练过了，可以这样加载：

sh download_pretrained.sh

网络中有一个crop层，默认是没有实现的，所以我们需要自己实现一下。

class CropLayer（object）：

def __init__（self， params， blobs）：

self.xstart = 0

self.xend = 0

self.ystart = 0

self.yend = 0

# Our layer receives two inputs. We need to crop the first input blob

# to match a shape of the second one （keeping batch size and number of channels）

def getMemoryShapes（self， inputs）：

inputShape， targetShape = inputs［0］， inputs［1］

batchSize， numChannels = inputShape［0］， inputShape［1］

height， width = targetShape［2］， targetShape［3］

self.ystart = （inputShape［2］ - targetShape［2］） // 2

self.xstart = （inputShape［3］ - targetShape［3］） // 2

self.yend = self.ystart + height

self.xend = self.xstart + width

return ［［batchSize， numChannels， height， width］］

def forward（self， inputs）：

return ［inputs［0］［：，：，self.ystart:self.yend，self.xstart:self.xend］］

现在，我们可以重载这个类，只需用一行代码注册该层。

cv.dnn_registerLayer（‘Crop’， CropLayer）

现在，我们准备构建网络图并加载权重，这可以通过OpenCV的dnn.readNe函数。

net = cv.dnn.readNet（args.prototxt， args.caffemodel）

现在，下一步是批量加载图像，并通过网络运行它们。为此，我们使用cv2.dnn.blobFromImage方法。该方法从输入图像中创建四维blob。

blob = cv.dnn.blobFromImage（image， scalefactor， size， mean， swapRB， crop）

其中：

image：是我们想要发送给神经网络进行推理的输入图像。

scalefactor：图像缩放常数，很多时候我们需要把uint8的图像除以255，这样所有的像素都在0到1之间。默认值是1.0，不缩放。

size：输出图像的空间大小。它将等于后续神经网络作为blobFromImage输出所需的输入大小。

swapRB：布尔值，表示我们是否想在3通道图像中交换第一个和最后一个通道。OpenCV默认图像为BGR格式，但如果我们想将此顺序转换为RGB，我们可以将此标志设置为True，这也是默认值。

mean：为了进行归一化，有时我们计算训练数据集上的平均像素值，并在训练过程中从每幅图像中减去它。如果我们在训练中做均值减法，那么我们必须在推理中应用它。这个平均值是一个对应于R， G， B通道的元组。例如Imagenet数据集的均值是R=103.93， G=116.77， B=123.68。如果我们使用swapRB=False，那么这个顺序将是（B， G， R）。

crop：布尔标志，表示我们是否想居中裁剪图像。如果设置为True，则从中心裁剪输入图像时，较小的尺寸等于相应的尺寸，而其他尺寸等于或大于该尺寸。然而，如果我们将其设置为False，它将保留长宽比，只是将其调整为固定尺寸大小。

在我们这个场景下：

inp = cv.dnn.blobFromImage（frame， scalefactor=1.0， size=（args.width， args.height），

mean=（104.00698793， 116.66876762， 122.67891434）， swapRB=False，

crop=False）

现在，我们只需要调用一下前向方法。

net.setInput（inp）

out = net.forward（）

out = out［0， 0］

out = cv.resize（out，（frame.shape［1］， frame.shape［0］））

out = 255 * out

out = out.astype（np.uint8）

out=cv.cvtColor（out，cv.COLOR_GRAY2BGR）

con=np.concatenate（（frame，out），axis=1）

cv.imshow（kWinName，con）

原文标题：在OpenCV中基于深度学习的边缘检测

文章出处：【微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

OpenCV

OpenCV

+关注

关注
31

文章
635

浏览量
41361
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121185

原文标题：在OpenCV中基于深度学习的边缘检测

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

边缘学习:降本增效,开启物流新未来

在当今数字化浪潮下，物流行业正经历着深刻变革。边缘学习作为一项基于AI的创新技术，已在物流领域崭露头角。它不仅能帮助物流企业应对突发公共卫生事件带来的挑战，还在包裹检测、分类和流程问题

发表于 12-20 09:07 •91次阅读

AI模型部署边缘设备的奇妙之旅：目标检测模型

1、简介人工智能图像识别是人工智能领域的一个重要分支，它涉及计算机视觉、深度学习、机器学习等多个领域的知识和技术。图像识别主要是处理具有一定复杂性的信息。计算机采用与人类类似的图像识别原理，即对

发表于 12-19 14:33

AI模型部署边缘设备的奇妙之旅：如何在边缘端部署OpenCV

、车辆和其他重要元素。 2 基础知识 OpenCV 是一个开源的计算机视觉和机器学习软件库，广泛用于图像处理、视频捕捉、物体检测等领域。一些常用操作及其目的：读取图片使用 cv2.imread

发表于 12-14 09:31

如何用OpenCV的相机捕捉视频进行人脸检测--基于米尔NXP i.MX93开发板

的是Haar特征人脸检测，此外OpenCV中还集成了深度学习方法来实现人脸检测。【参考资料】使用O

发表于 11-15 17:58

FPGA做深度学习能走多远？

，共同进步。欢迎加入FPGA技术微信交流群14群! 交流问题（一） Q：FPGA做深度学习能走多远？现在用FPGA做深度

发表于 09-27 20:53

图像边缘检测系统的设计流程

图像边缘检测系统的设计流程是一个涉及多个步骤的复杂过程，它旨在从图像中提取出重要的结构信息，如边界、轮廓等。这些边缘信息对于图像分析、机器视觉、图像压缩等领域至关重要。以下是一个详细的

发表于 07-17 16:39 •360次阅读

opencv图像识别有什么算法

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，提供了大量的图像处理和计算机视觉相关的算法。以下是一些常见的OpenCV

发表于 07-16 10:40 •1059次阅读

opencv-python和opencv一样吗

不一样。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了大量的图像和视频处理功能。OpenCV

发表于 07-16 10:38 •1211次阅读

opencv的主要功能有哪些

：OpenCV提供了丰富的图像处理功能，包括图像的读取、显示、保存、转换等。此外，OpenCV还支持图像的滤波、边缘检测、形态学操作、图像金字塔等高级图像处理技术。特征

发表于 07-16 10:35 •1556次阅读

深度学习在工业机器视觉检测中的应用

随着深度学习技术的快速发展，其在工业机器视觉检测中的应用日益广泛，并展现出巨大的潜力。工业机器视觉检测是工业自动化领域的重要组成部分，通过图像处理和计算机视觉技术，实现对产品表面缺陷、

发表于 07-08 10:40 •1075次阅读

基于AI深度学习的缺陷检测系统

在工业生产中，缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下，且易受人为因素影响，导致误检和漏检问题频发。随着人工智能技术的飞速发展，特别是深度学习技术的崛起，基于A

发表于 07-08 10:30 •1438次阅读

基于深度学习的小目标检测

在计算机视觉领域，目标检测一直是研究的热点和难点之一。特别是在小目标检测方面，由于小目标在图像中所占比例小、特征不明显，使得检测难度显著增加。随着深度

发表于 07-04 17:25 •890次阅读

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度

发表于 04-23 17:18 •1296次阅读

深度学习检测小目标常用方法

深度学习的效果在某种意义上是靠大量数据喂出来的，小目标检测的性能同样也可以通过增加训练集中小目标样本的种类和数量来提升。

发表于 03-18 09:57 •727次阅读

OpenCV零代码实现线段距离测量

OpenMV2024版本即将发行，支持多种主流深度学习模型从训练到部署，支持更多传统OpenCV算子流程设计与组合，支持一键导出流程，相比2

发表于 01-08 09:15 •668次阅读

搜索历史

OpenCV使用深度学习做边缘检测的流程

评论

边缘学习:降本增效,开启物流新未来

AI模型部署边缘设备的奇妙之旅：目标检测模型

AI模型部署边缘设备的奇妙之旅：如何在边缘端部署OpenCV

如何用OpenCV的相机捕捉视频进行人脸检测--基于米尔NXP i.MX93开发板

FPGA做深度学习能走多远？

图像边缘检测系统的设计流程

opencv图像识别有什么算法

opencv-python和opencv一样吗

opencv的主要功能有哪些

深度学习在工业机器视觉检测中的应用

基于AI深度学习的缺陷检测系统

基于深度学习的小目标检测

深度解析深度学习下的语义SLAM

深度学习检测小目标常用方法

OpenCV零代码实现线段距离测量