资料介绍
我们训练了一个大型的深度卷积神经网络,来将在ImageNet LSVRC-2010 大赛中的120万张高清图像分为1000 个不同的类别。对测试数据,我们得到了top-1 误差率37.5%,以及top-5 误差率17.0%,这个效果比之前最顶尖的都要好得多。该神经网络有6000 万个参数和650,000 个神经元,由五个卷积层,以及某些卷积层后跟着的max-pooling 层,和三个全连接层,还有排在最后的1000-way 的softmax 层组成。为了使训练速度更快,我们使用了非饱和的神经元和一个非常高效的GPU 关于卷积运算的工具。为了减少全连接层的过拟合,我们采用了最新开发的正则化方法,称为“ dropout”,它已被证明是非常有效的。在ILSVRC-2012 大赛中,我们又输入了该模型的一个变体,并依靠top-5 测试误差率15.3%取得了胜利,相比较下,次优项的错误率是26.2%。
1 引言
当前物体识别的方法基本上都使用了机器学习方法。为了改善这些方法的性能,我们可以收集更大的数据集,学习更强有力的模型,并使用更好的技术,以防止过拟合。直到最近,标记图像的数据集都相当小——大约数万张图像(例如,NORB [16] ,Caltech-101/256[8, 9] ,以及CIFAR-10/100 [12] )。简单的识别任务可以用这种规模的数据集解决得相当好,特别是当它们用标签-保留转换增强了的时候。例如,在MNIST 数字识别任务中当前最好的误差率(《0.3%)接近于人类的表现[4] 。但是现实环境中的物体表现出相当大的变化,因此要学习它们以对它们进行识别就必须使用更大的训练集。事实上,小规模图像数据集的缺陷已被广泛认同(例如, Pinto 等人[21]),但是直到最近,收集有着上百万张图像的带标签数据集才成为可能。更大型的新数据集包括LabelMe [23],它由几十万张完全分割图组成,还有ImageNet [6],它由多于22,000个种类中超过1500 万张带标签的高分辨率图像组成。
为了从几百万张图像中学习数以千计的物体,我们需要一个学习能力更强的模型。然而,物体识别任务的极大复杂性意味着这个问题不能被指定,即使是通过与ImageNet一样大的数据集,所以我们的模型中也应该有大量的先验知识,以补偿我们所没有的全部数据。卷积神经网络(CNN)构成了一个这种类型的模型[16, 11, 13, 18, 15, 22, 26]。它们的能力可以通过改变其深度与广度得到控制,它们也可作出有关图像性质的强壮且多半正确的假设(即,统计数据的稳定性和像素依赖关系的局部性) 。因此,与层次规模相同的标准前馈神经网络相比, CNN 的连接关系和参数更少,所以更易于训练,而其理论上的最佳性能可能只略差一点。不论CNN 的性质多有吸引力, 也不论它们局部结构的相对效率有多高,将它们大规模地应用到高分辨率图像中仍然是极其昂贵的。幸运的是,目前的GPU 搭配了一个高度优化的2D 卷积工具,强大到足以促进大规模CNN 的训练,而且最近的数据集像ImageNet2包含足够的带标签的样例来训练这样的模型,还不会有严重的过拟合。本文的具体贡献如下:我们在ILSVRC-2010 和ILSVRC-2012 大赛中使用过的ImageNet的子集上[2] ,训练了迄今为止最大型的卷积神经网络之一,并取得了迄今为止在这些数据集上报告过的最好结果。我们写了一个高度优化的GPU 二维卷积工具以及训练卷积神经网络过程中的所有其他操作,这些我们都提供了公开地址。我们的网络中包含一些既新鲜而又不同寻常的特征,它们提高了网络的性能,并减少了网络的训练时间,这些详见第3 节。我们的网络中甚至有120 万个带标签的训练样本,这么大的规模使得过拟合成为一个显著的问题,所以我们使用了几种有效的方法来防止过拟合,这些在第4 节中给以描述。我们最终的网络包含五个卷积层和三个全连接层,且这种层次深度似乎是重要的:我们发现,移去任何卷积层(其中每一个包含的模型参数都不超过1%)都会导致性能变差。
最后,网络的规模主要受限于当前GPU 的可用内存和我们愿意容忍的训练时间。我们的网络在两块GTX 580 3GB GPU 上训练需要五到六天。我们所有的实验表明,等更快的GPU 和更大的数据集可用以后,我们的结果就可以轻而易举地得到改进。
- 多尺度膨胀卷积神经网络在图像分类中的应用 14次下载
- 基于域适应的卷积神经网络人脸识别结构 7次下载
- 深度学习中的卷积神经网络层级分解综述 5次下载
- 基于剪枝与量化的卷积神经网络压缩算法 6次下载
- 基于不同神经网络的文本分类方法研究对比 48次下载
- 综述深度学习的卷积神经网络模型应用及发展 20次下载
- 使用深度卷积神经网络进行ImageNet数据库分类 4次下载
- 基于特征交换的卷积神经网络图像分类算法 27次下载
- 基于深度神经网络的文本分类分析 37次下载
- 基于多孔卷积神经网络的图像深度估计模型 5次下载
- 如何使用深度卷积神经网络改进服装图像分类检索算法 6次下载
- 如何使用复杂网络描述进行图像深度卷积的分类方法介绍 4次下载
- 如何使用混合卷积神经网络和循环神经网络进行入侵检测模型的设计 19次下载
- 卷积神经网络的权值反向传播机制和MATLAB的实现方法 14次下载
- 面向大规模图像分类的深度卷积神经网络的优化 3次下载
- 卷积神经网络共包括哪些层级 389次阅读
- 神经网络中的卷积层、池化层与全连接层 1703次阅读
- 全卷积神经网络的工作原理和应用 382次阅读
- BP神经网络和卷积神经网络的关系 530次阅读
- 卷积神经网络与循环神经网络的区别 881次阅读
- 深度学习与卷积神经网络的应用 545次阅读
- 卷积神经网络的基本概念和工作原理 1204次阅读
- 卷积神经网络在文本分类领域的应用 360次阅读
- 卷积神经网络的基本结构 251次阅读
- 详解深度学习、神经网络与卷积神经网络的应用 1574次阅读
- 详解卷积神经网络卷积过程 1.7w次阅读
- NVIDIA深度神经网络加速库cuDNN软件安装教程 2222次阅读
- 卷积神经网络CNN架构分析-LeNet 2687次阅读
- 初学者必读:卷积神经网络指南(一) 1683次阅读
- 【科普】卷积神经网络(CNN)基础介绍 1.1w次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1491次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 95次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 11次下载 | 免费
- 6100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB | 4次下载 | 免费
- 8基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537793次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多