3.2.4语义分割
图3-7所示为机器视觉语义分割示例。
计算机视觉的核心是分割,它将整个图像分成一个个像素组,然后对其进行标记和分类。语义分割试图在语义上理解图像中每个像素的角色(例如,识别它是道路、汽车还是其他类别)。如图3-7所示,除识别人、道路、汽车、树木等外,还必须确定每个物体的边界。因此,与分类不同,需要用模型对密集的像素进行预测。
与其他计算机视觉任务一样,卷积神经网络在分割任务上取得了巨大成功。最流行的原始方法之一是通过滑动窗口进行块分类,利用每个像素周围的图像块,对每个像素
分别进行分类。但是其计算效率非常低,因为我们不能在重叠块之间重用共享特征。解决方案之一就是加州大学伯克利分校提出的全卷积网络(FCN),它提出了端到端的卷积神经网络体系结构,在没有任何全连接层的情况下进行密集预测,如图3-8所示。
图3-8 全卷积网络(FCN)实现像素分类演示
这种方法允许针对任何尺寸的图像生成分割映射,并且比块分类算法快得多,几乎后续所有的语义分割算法都采用了这种范式。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
智慧灯杆
+关注
关注
1文章
815浏览量
11806
发布评论请先 登录
相关推荐
图像分割与语义分割中的CNN模型综述
图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的
智慧灯杆未来发展
智慧灯杆作为智慧城市建设的重要组成部分,以其独特的功能和优势正逐渐融入人们的日常生活中。随着科技的不断进步和人们对城市生活质量的要求不断提高,智慧
评论