0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CNN结构基本情况

新机器视觉 来源:人工智能感知信息处理算 作者:人工智能感知信息 2022-07-05 11:50 次阅读

深度学习机器学习算法研究中新开辟的研究方向,在图像领域的应用是最开始的尝试。近年以来,计算机视觉领域和 CNN 网络结构的不断更新发展,出现了一批代表性的深度卷积神经网络。本章节主要介绍目标检测算法 YOLO 系列借鉴了设计思想的这些框架,分别是:Le Net、Alex Net、VGG、Goog Le Net和 Res Net。表 1 所示,介绍了代表性的 CNN 结构基本情况。

a240625c-fc14-11ec-ba43-dac502259ad0.png

1 LeNet

LeNet 卷积神经网络是由深度学习三巨头之一的 Yan Le Cun于 1994 年提出来的。其对构建的 MNIST手写字符数据集进行分类。LeNet 的提出确立了 CNN 的基本网络架构。如下图所示,Le Net 通过输入32 ×32 字符矩阵经过卷积层、下采样层、全连接层进行图像的分类识别。但因为当时硬件技术的局限性和训练数据的不丰富性,Le Net 模型的运算效果并不是特别突出,但此特征网络的提出,为后续 Alex Net 的出现提供了重要的参考。

a2548bce-fc14-11ec-ba43-dac502259ad0.png

2 Alex Net

Alex Net的出现,标志着深度卷积神经网络开启了创新的新时代。之前由于硬件技术的局限性,CNN的学习能力、图像分类能力有限,而在 2012 年提出的卷积神经网络 Alex Net 采用了两个 GPU(NVIDIA GTX 580)来训练模型,然后将两个 GPU 上的特征图进行合并,采用的数据集是 Image Net(1500 多万个标记的图像,2.2万个类别),并在2012 ILSVRC大赛以优异的性能在计算机视觉领域展现了自己的实力。如图下图所示,Alex Net 的网络结构包括 5 层卷积、3 层池化和 3 层全连接,特征提取能力得到了提高,对大规模的数据集有更好的拟合能力。并且,在训练阶段,通过在模型随机的添加几个转换单元来确保网络具有较好的鲁棒性。其结构创新的要点为:

(1)使用 Re LU 作为非线性激活函数,减少梯度消失现象,提高收敛率,减少训练时间。

(2)使用大尺寸卷积核(5×5和11×11),提高网络感受野。 (3)加入 Drop Out 层抑制过拟合。 (4)使用数据增强技术,对图像进行训练时,随机的添加平移缩放、裁剪旋转、翻转或增减亮度等操作,产生一系列和输入图像相似但又不相同的数据,从而扩充了训练的数据集。

a29573b4-fc14-11ec-ba43-dac502259ad0.png

3 VGG

VGG(Visual Geometry Group)多层网络模型,比 Alex Net 和 Zef Net 的深度多了 19 层,验证了在网络结构上增加深度可以直接影响模型性能。VGG 有两种结构,分为 VGG16 和 VGG19,这二者的区别只在于网路深度不同。VGG 的设计思想是增加网络深度,改用小尺寸的卷积核。如下图所示,具体操作为:采用 3 个3×3 卷积核来替换 Alex Net 中的 7×7 卷积核,采用 2 个3×3 卷积核替换5×5卷积核,这样的设计可以在保证具有相同感受野的前提下,增加网络深度,提升模型效果,且改用小的3×3 Filters 可减少模型参数量和运算量,可以更好地保留图像特征信息。具体的改进优点总结为以下几点:

(1)采用3×3 小滤波器替换大尺寸卷积核

(2)替换卷积核后,卷积层的感受野相同

(3)每层卷积操作后通过 Re LU 激活函数和批处理梯度下降训练

(4)验证了增加网络深度,可以提升模型性能 虽然,VGG 在 2014 年因其更深的网络结构和计算低复杂度的优势,使其在图像分类和定位问题上取得了很好地成绩,但它使用了 1.4 亿个参数,计算量很大,这是它的不足之处。

a2b9b706-fc14-11ec-ba43-dac502259ad0.png

4 Goog Le Net

Goog Le Net是由 Google 提出的,获得了 Image Net 大赛冠军。其架构设计的核心是在保证高水准的精确性 Inception 的目标前提下,降低模型的计算成本。与 VGG 相比,Goog Le Net 是一个网络深度为 22 层的卷积神经网络,它不以传统 CNN 卷积层的串联堆叠为架构基础,而是创新的提出了 Inception 结构,用NIN(Networkin-Network)替换普通卷积层。如下图所示,该结构包含了 5×5 、 3×3 、1×1 滤波器,以便于在不同空间分辨率范围内捕捉通道信息和空间特征,添加一个1×1滤波器,作为 Bottle Neck ,来提高网络的效率,提升模型学习特征的能力。使用平均池化层代替全连接层,将 7×7×1024 的体积降到了 1×1×1024 ,减少了大量的参数。此外,Goog Le Net 还提出了辅助分类器 Soft Max,以加快收敛速度。但 Goog Le Net 也有短板,其表征堵塞会减少下一层的特征空间,反过来又可能会丢失有用的特征。

a2e83680-fc14-11ec-ba43-dac502259ad0.png

5 Res Net

Res Net(Residual Network)残差网络是 Kaiming He提出来的,并在 2015 ILSVRC 大赛以 3.57%的错误率获得了冠军。在之前的网络中,当模型深度不够,其网络识别能力不强,但当网络堆叠(Plain Network)很深的时候,网络梯度消失和梯度弥散现象明显,导致模型的运算效果却不升反降。因此,鉴于此深层网络的退化问题,Res Net 设计了一个不存在梯度消失问题的超深度网络。Res Net 根据层数的不同,从 18 层到 1202 层,有多种类型。以 Res Net50 为例,它由 49 个卷积层和 1 个全连接层组成,如下图所示。这种简单的加法并不会给网络增加额外的参数和计算量,同时却可以大大增加模型的训练速度、提高训练效果,并且当模型的层数加深时,这个简单的结构能够很好的解决退化问题。Res Net 提出了短径连接,当网络性能已达到最优,继续加深网络,残差映射将被设置为 0,只剩下恒等映射,加速网络收敛,这样就可以使得网络一直处于最优状态了,网络的性能也就不会随着深度增加而降低了。

a319b21e-fc14-11ec-ba43-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100533
  • 图像分类
    +关注

    关注

    0

    文章

    90

    浏览量

    11907
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120969

原文标题:图像分类模型的发展

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    cnn常用的几个模型有哪些

    CNN(卷积神经网络)是一种深度学习模型,广泛应用于图像识别、自然语言处理等领域。以下是一些常用的CNN模型: LeNet-5:LeNet-5是最早的卷积神经网络之一,由Yann LeCun等人于
    的头像 发表于 07-11 14:58 619次阅读

    图像分割与语义分割中的CNN模型综述

    图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的一种核心模型,在图像分割与语义分割中发挥着至关重要的作用。本文将从CNN模型的基本原理、在图像分割与语义分割中的应用、以及具体的模型架构和调
    的头像 发表于 07-09 11:51 670次阅读

    CNN与RNN的关系​

    在深度学习的广阔领域中,卷积神经网络(CNN)和循环神经网络(RNN)是两种极为重要且各具特色的神经网络模型。它们各自在图像处理、自然语言处理等领域展现出卓越的性能。本文将从概念、原理、应用场景及代码示例等方面详细探讨CNN与RNN的关系,旨在深入理解这两种网络模型及其在
    的头像 发表于 07-08 16:56 600次阅读

    CNN在多个领域中的应用

    ,通过多层次的非线性变换,能够捕捉到数据中的隐藏特征;而卷积神经网络(CNN),作为神经网络的一种特殊形式,更是在图像识别、视频处理等领域展现出了卓越的性能。本文旨在深入探究深度学习、神经网络与卷积神经网络的基本原理、结构特点及其在多个领域中的广泛应用。
    的头像 发表于 07-08 10:44 906次阅读

    CNN的定义和优势

    CNN是模型还是算法的问题,实际上它兼具了两者的特性,但更侧重于作为一种模型存在。本文将从CNN的定义、结构、原理、应用等多个方面进行深入探讨,旨在全面解析CNN的本质及其在计算机视觉
    的头像 发表于 07-05 17:37 4143次阅读

    如何利用CNN实现图像识别

    卷积神经网络(CNN)是深度学习领域中一种特别适用于图像识别任务的神经网络结构。它通过模拟人类视觉系统的处理方式,利用卷积、池化等操作,自动提取图像中的特征,进而实现高效的图像识别。本文将从CNN的基本原理、构建过程、训练策略以
    的头像 发表于 07-03 16:16 1110次阅读

    NLP模型中RNN与CNN的选择

    在自然语言处理(NLP)领域,循环神经网络(RNN)与卷积神经网络(CNN)是两种极为重要且广泛应用的网络结构。它们各自具有独特的优势,适用于处理不同类型的NLP任务。本文旨在深入探讨RNN与CNN
    的头像 发表于 07-03 15:59 421次阅读

    卷积神经网络的基本结构和工作原理

    卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的基本结构
    的头像 发表于 07-03 09:38 426次阅读

    cnn卷积神经网络分类有哪些

    卷积神经网络(CNN)是一种深度学习模型,广泛应用于图像分类、目标检测、语义分割等领域。本文将详细介绍CNN在分类任务中的应用,包括基本结构、关键技术、常见网络架构以及实际应用案例。 引言 1.1
    的头像 发表于 07-03 09:28 468次阅读

    cnn卷积神经网络三大特点是什么

    卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。CNN具有以下三大特点: 局部连接
    的头像 发表于 07-03 09:26 713次阅读

    卷积神经网络的基本结构和训练过程

    卷积神经网络(Convolutional Neural Networks,CNN)是一种在图像识别、视频处理、自然语言处理等多个领域广泛应用的深度学习算法。其独特的网络结构和算法设计,使得CNN
    的头像 发表于 07-02 18:27 754次阅读

    CNN模型的基本原理、结构、训练过程及应用领域

    CNN模型的基本原理、结构、训练过程以及应用领域。 卷积神经网络的基本原理 1.1 卷积运算 卷积运算是CNN模型的核心,它是一种数学运算
    的头像 发表于 07-02 15:26 2942次阅读

    卷积神经网络cnn模型有哪些

    卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。 CNN的基本概念 1.1 卷积层
    的头像 发表于 07-02 15:24 655次阅读

    深度神经网络模型cnn的基本概念、结构及原理

    ,其核心是构建具有多层结构的神经网络模型,以实现对复杂数据的高效表示和处理。在众多深度学习模型中,卷积神经网络(CNN)因其在图像识别等领域的卓越性能而备受关注。CNN通过引入卷积层和池化层,有效地捕捉了图像的局部特征和空间
    的头像 发表于 07-02 10:11 9539次阅读

    基于Python和深度学习的CNN原理详解

    卷积神经网络 (CNN) 由各种类型的层组成,这些层协同工作以从输入数据中学习分层表示。每个层在整体架构中都发挥着独特的作用。
    的头像 发表于 04-06 05:51 1960次阅读
    基于Python和深度学习的<b class='flag-5'>CNN</b>原理详解