基于深度学习的道路小目标检测优化方法

作者：曹健，陈怡梅，李海生，蔡强

复杂道路场景下的小目标检测能够提高车辆对于周边环境的感知能力，是计算机视觉和智慧交通领域的重要研究方向。

随着深度学习技术的发展，将深度学习方法与道路小目标检测相结合能够有效提高检测精度，使车辆快速对周边环境做出反应。

本文从经典及最新的道路小目标检测的研究成果出发，给出小目标的两种定义方式，分析造成道路小目标检测困难的原因，阐述数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5类基于深度学习的提高道路小目标检测精度的优化方法，总结归纳各类方法的核心思想及目前国内外最新的研究进展。

另外介绍了常用于道路小目标检测的大型和公共数据集，提供相应的用于评估小目标检测性能的指标，对比分析各类方法在不同数据集上的性能检测结果，指出道路小目标检测研究目前仍存在的问题，并结合这些问题从多个角度对其未来研究方向进行展望。

00 概述

道路目标检测是智能交通监控[1]、自动驾驶[2]、车牌识别[3]、行人跟踪[4]、车辆检测[5]等领域的重要研究分支之一，旨在识别和检测整个道路场景图像中感兴趣的目标，尤其是在复杂场景中的准确性和实时性是评测整个模型系统的重要指标，具有广泛的应用价值。但是自然交通场景的复杂多变以及道路各类目标本身在尺寸与距离上的干扰，使得目标识别和检测难度大大增加，其中小目标检测就是研究者关注的一个难点问题。对于大中型的车辆、行人等目标，通用的Two-stage和One-stage目标检测模型已经能够达到不错的检测效果，然而小目标的尺寸较小，不具备相应的形状和纹理特征，这些特性导致其检测性能仍有所欠缺，不能满足实际需求。

道路小目标的具体定义方式可参考小目标的定义方式，大致可分为两种：一种是绝对尺寸的定义方式，在通用的目标检测数据集MS COCO[6]中，尺寸小于32×32像素的目标被定义为小目标；另一种是相对尺寸的定义方式，根据国际光电仪器工程师协会（SPIE）的定义，小目标是指在大小为256×256像素的图像中目标区域小于9×9像素。

目前，道路小目标检测困难和效果相对较差的原因大致可以归结为以下4种：

1）相较于中大型行人车辆目标，包含小目标实例的图像较少，且道路场景复杂多变，小目标容易隐藏在背景中；

2）小目标在道路图像中面积占比小、分辨率低，携带的信息少，位置缺乏多样性，难以定位，因此，卷积神经网络提取到的可利用的有效信息非常有限；

3）特征提取时，输入图像经过卷积神经网络的多次下采样后，小目标的细节信息丢失严重，影响小目标的检测效果；

4）道路目标检测领域缺乏大规模通用的小目标检测数据集，目前该领域发布的公共数据集多为针对中大型的行人车辆进行检测，难以满足小目标的检测需求。

针对上述问题，国内外许多研究者提出了相应的改进和优化方法来提高小目标的检测精度。本文将主要从数据增强、多尺度策略、生成超分辨率（Super-Resolution，SR）细节信息、加强上下文信息联系、改进损失函数等5类改进方向出发进行归纳梳理，对各类方法的特点和优缺点进行比较，在MS COCO公共数据集以及其他不同道路场景数据集上对各类方法的检测性能进行评估和对比分析，并对道路小目标检测的未来研究方向进行展望。

01 针对小目标检测的优化方法

1.1 数据增强

数据增强是一种扩展数据的技术，在缺乏数据或数据量有限的情况下，该技术可以利用有限的数据来创造尽可能多的价值并尽可能满足研究者的需求。尽管现在有很多用于各种任务的公开数据集，但数据量在使用中远远不够，而收集和制作这些数据的成本其实是非常高的且不便于采集，因此数据增强便成为了一种快速有效的改进方法。在大部分目标检测的数据集中，小目标的实例数量占比少，在训练和检测中容易被忽略。通过数据增强来增加小目标的样本数量，可有效改进小目标的检测精准度。常用的数据增强方法可大致分为单样本数据增强和多样本数据增强两类。

典型的单样本数据增强方法主要是在一张预检测的图像上进行翻转、裁剪、缩放、添加噪声、变换颜色等操作，改变图像原有的状态，可有效增加数据集的样本数量和提高网络的泛化能力。文献[7]使用过采样和基于复制粘贴的增强方法进行改进，并在将对象粘贴到新位置前，对其应用两种缩放图像和旋转图像的随机变换，然后将小目标粘贴到新的位置，并确保新粘贴的目标不与任何现有目标相重叠，且距离图像边界至少5个像素。文献[8]对输入的每一张图像先采用缩放操作，在缩放操作后进行增强对比度、翻转、改变亮度和以0.5的概率随机角度旋转等操作。文献[9]在小目标数据集上，将每张图片上的小目标物体在训练时复制3次，使得网络在训练过程中可以更容易地提取目标的特征信息。文献[10]通过几何变换和颜色变换等进行数据增强，增加了数据集的数据量。文献[11]提出自动数据增强策略，与手工制定的策略不同，该策略利用自动算法在多种增强候选者中进行搜索，且该策略也可以应用于其他数据集和框级任务。文献[12]利用自动机器学习（Auto Machine Learning，Auto ML）原理设计自动搜索数据增强技术用于行人检测，从而产生最佳的数据增强策略。

近些年，许多研究者也提出了多种通用的多样本数据增强方法，包括MixUp[13]、CutOut[14]、CutMix[15]、Mosaic[16]等方法，这些方法通过将多张图像以某种方式合成到一起形成新的样本，达到扩充数据集容量的目的。MixUp方法将两张图像以一定的概率和比例拼凑到一起，比例分配决定了分类结果。CutOut是在图像中随机选择某一部分区域进行裁剪。CutMix是将两种方法相结合，先裁剪掉一张图像的某一部分，再使用另一张图像中的某一部分进行填充形成新的样本。Mosaic数据增强方法是目前最常用的数据增强方法之一，该方法借鉴了CutMix增强方法，将采用的2张图像扩充为4张图像，先对4张图像进行随机裁剪、缩放、翻转等操作，然后将4张图像拼接形成一张新的图像。这个操作在扩充了数据集的同时也增加了小样本的数量，并且极大地丰富了检测对象的背景。在YOLOv4[16]和YOLOv5[17]模型结构中，均使用了Mosaic数据增强方法，以此提高了模型学习能力和效率。文献[18]也将Mosaic数据增强方法引入改进后的CenterNet[19]中，以此优化算法的训练模式，丰富检测背景，优化检测性能。

1.2 多尺度策略

在使用卷积神经网络进行特征提取时，不同的网络深度对应不同层次的特征。低层特征的分辨率更高，像素更丰富，包含更多的细节信息和位置信息，对于目标的定位有极大帮助，但包含的语义信息较少；高层特征包含更丰富的语义信息，极大地促进了对象的分类，但分辨率较低，像素较少，对细节位置信息的感知能力较差。对于小目标行人、车辆以及指示牌而言，它们的尺寸小，分辨率低，在多次下采样后，特征图不断缩小，致使小目标的细节信息严重丢失，而多数通用检测器仅采用最后一层的特征图来定位目标和预测置信度分数，其中包含丰富的分类信息但缺乏详细信息，使得小目标物体容易出现误检和漏检的情况。多尺度策略的提出有效缓解了这一问题，在计算量不大的情况下，增强了物体特征的表达能力，提高小目标检测的性能。目前，典型的多尺度策略有图像金字塔、SSD算法和特征金字塔网络（Feature Pyramid Network，FPN）。

图像金字塔是图像多尺度表达的一种，通过对原始图像进行下采样，得到一系列以金字塔形状排列的分辨率逐渐降低的子图集合，构成图像金字塔。图像金字塔结构如图 3所示。

图3 图像金字塔结构

文献[20]将背景差分目标检测模型与高斯图像金字塔相结合用于多目标的检测，减少了误检测。文献[21]指出当前在极端尺度变化下目标检测训练存在的缺点，在此基础上提出一种新的训练方案，即图像金字塔尺度标准化（Scale Normalization for Image Pyramid，SNIP），在训练和反向传播更新参数时，只考虑在指定的尺度范围内的目标，即只对大小合适的某些目标进行训练，以此提高小目标的检测效率。然而，图像金字塔方法的一个明显限制是它在处理一张图像时需要较大的计算量，模型必须对来自所有尺度的图像执行独立的计算。

SSD算法使用步长为2的卷积来降低特征图的大小，以不同尺度的特征图作为检测层来分别预测不同尺度目标的类别和位置坐标，较大的特征图用来检测小目标，较小的特征图用来检测大目标，实现多尺度目标的检测。SSD算法的多尺度检测如图 4所示。

图4 SSD算法的多尺度检测

文献[22]提出DSSD网络，使用ResNet-101更换SSD的骨干网络VGG16，提高了模型的特征提取能力，并使用反卷积层增加了上下文信息，提升了多尺度目标及小目标的检测精度。文献[23]提出一种基于稀疏连接和多尺度融合的Inception-SSD行人检测方法，使用Inception模型代替骨干网络的基础部分，将全连接转换为稀疏连接，有效缓解了参数空间大、容易过拟合、梯度分散、模型性能下降等问题。

由于SSD多层特征图为非连续结构，所得到的信息不足，影响检测性能，因此特征金字塔通过引入自上而下的连接[24]来解决SSD模型存在的问题。特征金字塔是目前最常使用的多尺度特征融合方法，针对图像中不同物体具有不同的尺度，利用自下而上的路径、自上而下的路径和横向连接三部分完成多尺度检测。自下而上的路径是卷积神经网络的前向过程，选取每个阶段最后一层的输出构成特征金字塔；自上而下的路径通过从更高的金字塔级别对空间上更抽象但语义更强的特征图进行上采样来生成更高分辨率的特征图；横向连接合并了自下而上路径和自上而下路径的相同空间大小的特征图，将来自低层特征图的详细位置信息和来自高层特征图的丰富语义信息相融合，实现了不同尺度的特征提取，显著提升了小目标的检测性能。特征金字塔结构如图 5所示。

图5 特征金字塔结构

文献[25]将FPN网络中的Add融合方式更改为Concat方式来融合经多次卷积后提取的特征。文献[26]提出一种融合FPN和Faster R-CNN[27]的行人检测算法，获得了较好的检测效果。文献[28]提出基于FPN的路径聚合网络（PANet），在FPN后增加自下向上的路径增强，能够缩短信息路径并利用低层中存在的准确定位信息来增强特征金字塔，得到语义信息和定位精度上的双重提升，从而提高了对于多尺度目标的检测能力。PANet结构如图 6所示，其中，Pi和Ni表示不同层级的特征图，Ni是由包括Pi等多个特征图融合后的结果。

图6 PANet结构

文献[29]针对FPN网络存在自顶向下路径中信息稀释导致较低层获得的语义信息有限、高层特征缺乏空间信息的问题，将语义金字塔模块和语义特征融合模块加入检测模型，提出语义特征金字塔网络（SFPN），以解决信息不平衡问题并防止在特征融合过程中发生稀释。文献[30]提出新的图像金字塔引导网络（IPG-Net），创建了一条新的路径来缓解空间信息和语义信息之间的不平衡和错位问题，将IPG-Net信息不断融入主干流，解决了深层空间信息不足和小物体特征丢失的问题。文献[31]提出图特征金字塔网络（GraphFPN），该网络的拓扑结构能够动态适应输入图像的内在结构，并支持所有尺度特征的同时交互，继承输入图像的超像素层次结构，使用上下文层和等级间交互层来分别促进相同尺度内和不同尺度间的特征交互，避免了FPN网络中来自非相邻尺度的特征只能间接交互的问题。

1.3 超分辨率细节信息生成

相较于低分辨率（Low-Resolution，LR）图像，高分辨率（High-Resolution，HR）图像的像素密度较高，能够提供更多原始场景下精细的细节信息和可区分的特征，在检测中能够获得更佳的检测效果。因此，生成超分辨率图像也是对小目标的检测精度进行改进的一种有效方法，旨在从相应的低分辨率特征中恢复高分辨率特征，将生成的高分辨率图像作为检测模型的输入，获得更多小物体的细节信息。

目前，该类方法大部分主要通过生成对抗网络（Generative Adversarial Network，GAN）[32]的方式将小目标的特征转化为与中大型目标一样或相近的特征表达来恢复或重建高分辨率图像，其中生成器用于从低分辨率图像中生成超分辨率图像来欺骗判别器，判别器对真实图像和生成器生成的仿真超分辨率图像进行区分，预测目标的类别和位置，整体流程如图 7所示。

图7 基于GAN的细节信息生成流程

文献[33]将GAN引入小目标检测构建一种Perceptual GAN，基于深度残差特征的生成器模型将底层特征作为输入，将小物体的原始较差特征转换为具有高判别力的特征，从而在中间表示上生成超分辨率图像，判别器通过对细粒度细节信息的生成进行指导以提高生成目标的质量，有利于小目标的检测。文献[34]提出一种可与多种检测器相结合的SOD-MTGAN，在生成器中引入超分辨率网络实现对小目标图像的大范围上采样，生成超分辨率图像，并在判别器中引入用于目标检测的分类和回归损失进行联合识别与反向传播，以进一步指导生成器网络生成超分辨率图像，使得小目标在检测中更易定位和识别。文献[35]提出一种新的特征级超分辨率图像生成方法，通过空洞卷积对网络输入的低分辨率特征感受野和目标高分辨率特征感受野进行匹配，提高超分辨率图像生成质量，并对超分辨率生成器进行直接监督，提高训练稳定性，总体模型结构如图 8所示，其中，I为原始输入图像，×0.5表示对图像进行下采样，F为来自原始图像的低分辨率特征，T为SR目标提取器提取到的真实目标的超分辨率特征，S为生成的超分辨率特征。

图8 特征级超分辨率图像生成模型结构

文献[36]使用超分辨率子网络从大规模行人中恢复小规模行人的详细信息，将分类任务和超分辨率图像生成任务集成在一个统一的JCS-Net框架中，使得重建图像特征更适合小尺度行人的检测。文献[37]提出一种新的静止小波扩张残差超分辨率图像生成网络（SWDR-SR），以极大地增强图像的边缘信息并减少模糊现象，从而改善行人的检测效果。

1.4 上下文信息联系加强

在一张道路图像中，小目标占比较小，在检测中能够提取到的信息和特征稀少且有限，但小目标周围的区域总是包含很多其他对象的信息以及场景信息，这些信息在检测中能够提供帮助但却容易被忽略，因此加强小目标附近的上下文信息联系，将上下文信息加入小目标的检测，能够有助于增强特征表示，提高小目标的检测精度。

文献[38]引入一个简单而强大的空间记忆网络框架（SMN），对实例级上下文进行建模，该网络本质上是将对象实例重新组合成一个伪图像表示。文献[39]对对象之间的关系进行建模，在检测模型中添加对象关系模块以增强检测效果。文献[40]构建一个网络，利用行人实例之间的相关性，将行人目标的头顶区域和较低区域作为空间上下文，利用行人与场景之间的相关性，引入GRU[41]模块，将编码的上下文作为输入来指导每个候选目标的特征选择和融合，具体的关系上下文结构如图 9所示，其中，节点v表示选中的感兴趣区域，r表示每对实例节点之间的关系，f表示感兴趣区域的视觉特征，m表示其他节点到节点vi的关系消息，ht+1为GRU模型输出的节点状态。

图9 关系上下文结构

文献[42]提出一种用于目标重新检测的空间上下文分析方法（FS-SSD），通过考虑一定距离内多类对象的相互作用，计算不同对象实例之间的类间和类内距离作为空间上下文，以重新验证某些对象实例的置信度，这种重检测方法充分利用空间关系，有助于处理多类小目标检测。文献[43]使用来自更高层的更多抽象特征作为上下文，并从小物体的周围像素中提取上下文信息，然后将上下文感知信息添加到SSD网络，以便更好地进行检测。文献[44]提出高效的选择性上下文网络（ESCNet）来解决SSD网络上下文探索不足的问题，其中增强上下文模块（ECM）通过利用原始尺度、小尺度和大规模上下文信息来增强浅层特征，而三重注意力模块（TAM）用来融合上下文信息并选择性地细化特征。

1.5 损失函数改进

在目标检测任务中，损失函数具有重要作用。损失函数往往用于检测模型最后一部分，一般的目标检测算法包含两类损失函数：一类是分类损失函数；另一类是回归损失函数，而YOLO系列检测算法还包含置信度损失函数。针对不同的检测器和检测场景，选择或设计不同的损失函数会产生不同的收敛效果，通过对损失函数进行改进，可以对小目标取得更高的检测准确率。目前，常用的损失函数改进方法大致可分为两种：一种是对模型本身的损失函数进行优化；另一种是更换模型的损失函数。

针对实验中所选用的不同数据集，根据实际需求，对模型本身的损失函数进行优化和调整是提高小目标检测精度的一种有效方法。文献[45]考虑到尺寸小的待检测目标的损失函数通常会被忽略，使得小目标检测精度受到影响，通过调整大小尺度目标对损失值的影响权重，降低大目标误差对小目标检测效果的影响，使得小目标和大目标对损失函数的影响程度相同。文献[46]考虑到道路行人、车辆等各类目标数据量的不同，增加损失函数中目标分类误差的权重，并增强负样本对损失贡献的惩罚，有效降低了小目标的误检率。

虽然对模型本身损失函数进行调整能适当提高小目标检测精度，但由于小目标物体在道路图像中占比低、数量少，训练阶段小目标对损失函数的贡献较小，且会加剧样本不均衡的问题。为了缓解这种情况，采用性能更优、收敛速度更快的损失函数替代模型原有的分类损失函数成为目前常用的改进方法。文献[47]设计一种新的损失函数（CUA），通过进一步考虑训练阶段的类别不确定性来指导目标检测，使得网络专注于输出小目标不明确等情况。文献[48]针对现有锚框匹配不平衡的问题，设计尺度平衡损失函数取代FSSD[49]、RefineDet[50]等方法中使用的保持匹配平衡的对应函数，通过在原有的基础上进行加权运算，减少匹配次数多的目标所占的比例，增大匹配次数少的小目标的权重，提高小目标的检测精度和召回率。文献[51]鉴于小目标物体属于困难检测样本，在引入Focal Loss增大困难样本的损失权重的同时结合反馈机制与空洞卷积，提高了道路小目标的检测精度。文献[52]针对目标预测框出现在真实框的内部时GIoU[53]退化为IoU[54]使得位置关系无法区分的问题，使用CIoU[55]代替GIoU作为回归损失，使得目标框在回归过程中更稳定，收敛精度更高。各类道路小目标检测优化方法的优缺点对比如表 1所示。

表 1　各类道路小目标检测优化方法的优缺点对比

02 数据集、评价指标及性能对比

2.1 数据集

构建一个小目标检测数据集需要花费大量时间，并且对于小目标的有限像素而言，正确放置边界框的定位等都是有困难的。在目前的研究中，对于小目标的检测并没有通用的数据集，多数研究者选择在一些大型公共的数据集上进行性能验证。当前，道路目标检测领域已经公开了许多公共的大型数据集，包括KITTI[56]、BDD100K[57]、ApolloScape[58]、D2-City[59]和Waymo[60]，这些数据集通常包括数据量大、数据源丰富、应用场景覆盖全面等特点，这对于道路目标检测的方法研究和成果展示起着至关重要的推动作用和贡献。除了前面介绍的几种数据集，研究者还提出了其他的道路目标检测数据集，例如A*3D[61]、nuScenes[62]等。

1）KITTI数据集

2012年，德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办了KITTI数据集，该数据集是目前自动驾驶场景下常用的计算机视觉算法评测数据集之一。KITTI数据集中的图像包含在卡尔斯鲁厄市区、乡村、高速公路等场景中采集到的真实图像数据，采集到的每张图像中最多可达15辆车和30个行人以及各种不同程度的遮挡与截断，包含的类别可分为汽车、货车、卡车、有轨电车、行人、坐着的行人、骑自行车的人等7种与道路交通有关的对象类别。

2）BDD100K数据集

2018年，美国伯克利人工智能研究实验室发布了BDD100K开源视觉驾驶场景数据集，该数据集收集了美国不同地区的城市街道、居民区和高速公路的100 000个视频，每个视频时长约40 s，在每个视频的第10秒对关键帧进行采样，得到100 000张1 280×720像素的图像。该数据集涵盖了晴天、多云、阴天、雨天、雾天、下雪等6种不同的天气状况以及黎明、黄昏、白天、夜间等不同时段，包含的目标类别可分为公共汽车、交通灯、交通标志、行人、自行车、卡车、摩托车、小汽车、火车、骑手等。

3）ApolloScape数据集

2018年，百度发布了一个大规模自动驾驶数据集——ApolloScape，其是一个像素级标注的场景解析数据集，图像采集来自中国的北京、上海和深圳。该数据集包括143 906张像素级语义标注图像，属于业界环境复杂、标注精准、数据量大的公开3D自动驾驶数据集，标注精度上超过了同类型的KITTI和BDD100K数据集，致力于向研究者提供具有挑战性的数据支持。

4）D2-City数据集

D2-City是一个大规模行车视频数据集，采集自运行在中国多个城市的市区和郊区的滴滴运营车辆，涵盖了中国不同城市的道路行车场景，提供了更多复杂和具有挑战性的天气、交通等状况，包括道路拥堵、雨雾天气、低光环境、图像清晰度低等。该数据集提供了12类道路对象的注释，包括汽车、面包车、公共汽车、卡车、人、自行车、摩托车、开放式三轮车、封闭式三轮车、叉车以及大小街区。

5）Waymo数据集

2019年，自动驾驶公司Waymo发布了大规模、高质量、多样化的Waymo数据集，该数据集包含1 150个场景，每个场景跨越20 s，包括在美国凤凰城、山景城和旧金山的城市和郊区捕获的经过良好同步和校准的高质量LiDAR和相机数据。目前，该数据集定义了2D和3D对象检测和跟踪任务，未来研究者计划添加地图信息、更多标记和未标记数据，使其更加多样化。

表 2根据不同的应用场景，简要对这些比较有影响力的常用大型道路目标检测数据集进行了介绍。

表2 道路场景数据集

除了上述列举的常用大型数据集外，很多研究者也会在MS COCO[6]、PASCAL VOC[63]等包含有关小目标类别的大型数据集或自建的数据集上对检测模型或优化方法进行验证。表 3对MS COCO、PASCAL VOC这两类常用的公共数据集进行了简要介绍。

表3 MS COCO 和 PASCAL VOC 数据集

2.2 评价指标

对于道路场景小目标检测的评价指标主要包括检测精度和检测速度这两方面。检测精度主要使用平均精度（Average Precision，AP）和多个类别的平均精度均值（mean Average Precision，mAP）来衡量模型检测性能的优劣，AP和mAP的计算公式分别如式（1）和式（2）所示：

其中：代表所有类别数；代表模型对于第i个类别的物体的平均精度。

模型检测速度主要反映了算法的实时性，也是一个重要的评价指标，通常采用每秒帧率（Frame Per Second，FPS），即算法平均每秒检测的图像数量进行衡量。FPS越高，模型检测速度越快，实时性能越好。

2.3 性能对比

一部分优化方法基于MS COCO数据集训练模型并进行验证，另外一部分优化方法在PASCAL VOC 2007、KITTI道路场景数据集以及自建的数据集上进行模型性能验证，这里将分为两部分进行性能对比。

不同检测模型在MS COCO数据集上的性能测试结果如表 4所示，其中，AP50和AP75分别表示IoU阈值为0.5和0.75时目标检测的平均精度，APS、APM和APL分别表示小、中、大尺度检测目标的平均精度，最优指标值用加粗字体标示。

表4 不同检测模型在 MS COCO 数据集上的测试结果

由表 4可以看出，文献[21]模型在多个指标上都取得了最佳的检测结果，在多尺度策略的基础上，采用一种新的图像金字塔尺度归一化（SNIP）训练策略，只选取分辨率落入所需尺度范围的目标进行训练，忽略其他目标。通过这种训练设置，可在最合理的范围内处理小目标物体，以此提高了小目标的检测精度，却不影响对中大型对象的检测性能。文献[7]模型基于数据增强的优化方法相比于其他模型性能较差，主要原因为其在大型数据集中仅使用数据增强，对小目标检测的性能提升是有限的，还需与其他方法结合使用。对于同一个优化方法，IoU阈值设置为0.5时取得的AP值较高，当IoU提高时，精度也会降低。虽然优化后的模型在小尺度目标上的检测精度有所提升，但整体上小尺度的检测精度与中大尺度的检测精度仍有着明显的差距，仅约为大尺度目标的1/2，这也说明了小目检测的难度较大。

总体来看，针对小目标检测的优化方法对于3个尺度目标的检测性能均有一定提升，各类检测模型均在大尺度目标上的敏感性更好，获得的检测精度最高，而其中基于多尺度策略的检测模型在3个尺度目标的检测上得到了最好的检测结果，基于超分辨率细节信息生成的检测模型次之，而仅基于数据增强方法的检测模型对目标的敏感度最低，性能提升微弱。因此，当数据集容量偏小且数据集构成比较简单时，采用数据增强能对目标检测性能有一定的提升，而在大型复杂数据集中，其他方法改进效果更加显著，而使用基于多尺度策略的优化方法得到的小目标的平均精度要高于其他方法，因此可以成为未来一个主要的研究方向。

表 5展示了一些检测模型在KITTI等道路场景数据集及自建的数据集上的检测性能，与原始模型相比，优化后的模型在精度和速度上都得到了一定的提升，但与在MS COCO数据集上进行的实验结果相比，在这些数据集上的实验结果无法表现出明显的交叉评估性能。

表5 不同检测模型在其他数据集上的测试结果

03 未来研究方向

目前，在道路场景下的小目标检测已取得了较大进步，下一步将对其在多个数据集上的检测性能以及在可靠性、通用性、鲁棒性等方面的表现做进一步研究。

1）构建适应性和普适性更强的检测模型。许多通用的检测模型对于复杂道路场景下行人、车辆等小目标的类型、大小等较敏感，需要根据不同的场景调整参数，例如学习率：当设置较大的学习率时模型可能永远不会收敛，当设置较小的学习率时模型会给出次优结果。因此，建立适应性和普适性更强的检测模型是一个重要的研究方向。

2）设计性能更优和更适合小目标检测的专用骨干网络。深层次的骨干网络可能不利于小目标提取高质量的特征表示，因此需要设计一个有效的骨干网络，既具有强大的特征提取能力，能更好地提升小目标的检测性能，又能减少高昂的计算成本和目标信息的丢失，这也是目前研究的一大趋势。

3）构建更轻量化的检测模型。不同的应用场景对检测精度和速度的侧重不同，当应用于智能交通等领域时，对于检测速度的追求是首选，在检测模型中融入特征融合结构已成为道路小目标检测中的最常用的研究方法，但该方法会降低检测速度，增加时间消耗，因此需要构建更轻量化的检测模型，在保持一定精度的前提下设计灵活度更高的网络结构，满足模型轻量化、易于移植的需求，实现模型在车辆设备上的快速部署，具有很强的现实意义。

4）构建大规模通用的道路小目标检测数据集。小目标数据集的缺乏是影响小目标检测的一个重要因素，现有的数据集或自建的数据集包含多类小目标的数量非常有限，无法支持基于深度学习的小目标检测定制模型的训练以及性能评估，因此构建小目标数据集对于推进小目标检测的发展具有重要的意义。

5）采用合适的训练策略。在大部分数据集中，小目标物体占比小、数量少，因此可采用一些特定的训练方式，包括多尺度训练、增加小目标的训练权重以及多个数据集进行联合训练等，使得模型对小尺度目标的泛化能力增强，在训练时对小目标的学习更加充分。这也是提高小目标检测性能的有效措施，具有广阔的发展前景。

04 结束语

道路小目标检测是计算机视觉领域的一个极具挑战性的问题。本文从数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5个方面对基于深度学习的道路场景下的小目标检测优化方法的最新研究进展进行归纳和总结，并根据定量和定性结果对各类优化方法的性能进行评估。后续将对探索设计性能更优和更轻量化的检测模型、构建小目标数据集、改进训练策略等方向进行更深入研究。

编辑：黄飞

阅读全文

神经网络(98386) 神经网络(98386)
分辨率(41529) 分辨率(41529)
SSD(115270) SSD(115270)
自动驾驶(162872) 自动驾驶(162872)
深度学习(119798) 深度学习(119798)

深度学习中的YOLOv2-Tiny目标检测算法详细设计

近年来，以卷积神经网络（Convolutional Neural Network，DNN）为代表的深度学习算法在许多计算机视觉任务上取得了巨大突破，如图像分类、目标检测、画质增强等［1-2］。然而

2020-11-30 14:01:46

10735

基于深度学习的三维点云配准方法

基于深度学习的三维点云配准方法成为研究的主流，并随之诞生了DeepVCP、DGR、Predator等著名的方法。

2022-11-29 11:41:24

1338

如何在OpenCV中使用基于深度学习的边缘检测？

在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的边缘检测，它比目前流行的canny边缘检测器更精确。

2023-05-19 09:52:29

1609

深度学习在汽车中的应用

未来的某个时候，人们必定能够相对自如地运用人工智能，安全地驾车出行。这个时刻何时到来我无法预见；但我相信，彼时“智能”会显现出更“切实”的意义。与此同时，通过深度学习方法，人工智能的实际应用能够在汽车

2019-03-13 06:45:03

深度学习在预测和健康管理中的应用

方法方面的最新进展，目的是发现研究差距并提出进一步的改进建议。在简要介绍了几种深度学习模型之后，我们回顾并分析了使用深度学习进行故障检测，诊断和预后的应用。该调查验证了深度学习对PHM中各种类型的输入

2021-07-12 06:46:47

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度学习存在哪些问题？

2021-10-14 08:20:47

深度学习实现目标检测俄罗斯总统***对沙特王储摊的“友好摊手”瞬间

CV：2108足球世界杯—深度学习实现目标检测俄罗斯总统***对沙特王储摊的“友好摊手”瞬间—东道主俄罗斯5-0完胜沙特

2018-12-21 10:31:24

深度学习技术的开发与应用

时间安排大纲具体内容实操案例三天关键点1.强化学习的发展历程2.马尔可夫决策过程3.动态规划4.无模型预测学习5.无模型控制学习6.价值函数逼近7.策略梯度方法8.深度强化学习-DQN算法系列9.

2022-04-21 14:57:39

深度学习框架只为GPU?

CPU优化深度学习框架和函数库机器学***器

2021-02-22 06:01:02

深度学习的改进方法

深度学习如何改进（一）

2019-07-01 16:46:00

目标检测 | 已开源！全新水下目标检测算法SWIPENet+IMA框架

，基于深度学习的方法在标准的目标检测中取得了可喜的性能。水下目标检测仍具有以下几点挑战：（1）水下场景的实际应用中目标通常很小，含有大量的小目标；（2）水下数据集和实际应用中的图像通常是模糊的，图像中具有

2020-07-24 11:05:39

目标检测实战

深度学习目标检测系列：faster RCNN实现附python源码

2019-08-29 08:49:13

AI工程师 10 个深度学习方法

学到了大量关于深度学习的相关知识。在这里，我想分享人工智能工程师 10 个用于解决机器学习问题的强大的深度学习方法。但是，我们首先需要定义什么是深度学习。如何定义深度学习是很多人面临的一个挑战，因为它

2019-03-07 20:17:28

CV：基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别

2018-12-21 10:31:47

Labview深度学习tensorflow人工智能目标检测-教学贴【连载】

本帖最后由 wcl86 于 2021-6-3 16:23 编辑应广大学员要求，现开通Labview深度学习tensorflow人工智能目标检测-教学贴，有需要的学员，可以收藏本贴，接下来会

2021-05-28 11:58:52

MATLAB的行人目标检测的方法有哪些？

MATLAB的行人目标检测的方法有哪些，就是主要的方法，基于背景的，基于目标的，还有其他的。都有哪些？

2023-08-23 16:30:20

Nanopi深度学习之路(1)深度学习框架分析

着手，使用Nanopi2部署已训练好的检测模型，例如硅谷电视剧的 Not Hotdog 检测器应用，会在复杂的深度学习历程中有些成就感。目前已有几十种流行的深度学习算法库，参考网址：https

2018-06-04 22:32:12

labview+yolov4+tensorflow+openvion深度学习

我们通过传统算法无法量化，或者说很难去做到的，深度学习可以搞定。特别是在图像分类，目标检测这些问题上取得了显著的提升。下图是近几年来深度学习在图像分类问题上取得的成绩。之所以提出上面的算法

2021-05-10 22:33:46

labview深度学习PCB插件光学检测

`labview在检测PCBA插件的错、漏、反等缺陷中的应用检测原理通过高精度彩色工业相机不停板实时抓取板卡图像，采取卷积神经网络算法处理图像，智能判定元器件不良。采用最新的深度学习算法对电容，光耦，二极管等训练模型，能兼容不同pcb板，不同环境。`

2021-07-13 15:27:47

　　华为云深度学习服务，让企业智能从此不求人

主要基于人工实现，耗时费力。现在企业人员基于华为的深度学习服务，自行加载标注好的环境健康安全检查项目标注图片，就可以很快生成EHS图片检测模型，后续企业进行EHS检查时，只需要拍摄现场照片，输入模型

2018-08-02 20:44:09

【HarmonyOS HiSpark AI Camera】基于深度学习的目标检测系统设计

项目名称：基于深度学习的目标检测系统设计试用计划：尝试在硬件平台实现对Yolo卷积神经网络的加速运算，期望提出的方法能够使目标检测技术更便捷，运用领域更广泛。针对课题的研究一是研究基于开发板低功耗

2020-09-25 10:11:49

一种基于图像平移的目标检测框架

1、摘要近年来，在深度卷积神经网络(CNNs)的帮助下，图像和视频监控在智能交通系统(ITS)中取得了长足的进展。作为一种先进的感知方法，智能交通系统对视频监控中每一帧感兴趣的目标进行检测是其广泛

2021-08-31 07:43:19

什么是深度学习？

深度学习是什么意思

2020-11-11 06:58:03

什么是深度学习？使用FPGA进行深度学习的好处？

) 来解决更复杂的问题，深度神经网络是一种将这些问题多层连接起来的更深层网络。这称为深度学习。目前，深度学习被用于现实世界中的各种场景，例如图像和语音识别、自然语言处理和异常检测，并且在某些情况下，它

2023-02-17 16:56:59

全网唯一一套labview深度学习教程：tensorflow+目标检测：龙哥教你学视觉—LabVIEW深度学习教程

`【新课上线】tensorflow+目标检测：龙哥教你学视觉—LabVIEW深度学习教程（强推）课程目标：1、让没有任何python，tensorflow基础的学员学习到如何搭建深度学习训练平台。2

2020-08-10 10:38:12

吴恩达深度学习

吴恩达深度学习第三课第三周目标检测

2020-05-28 09:03:14

基于深度学习的异常检测的研究方法

ABSTRACT1.基于深度学习的异常检测的研究方法进行结构化和全面的概述2.回顾这些方法在各个领域这个中的应用情况，并评估他们的有效性。3.根据基本假设和采用的方法将最先进的深度异常检测技术分为

2021-07-12 06:36:22

基于深度学习的异常检测的研究方法

异常检测的深度学习研究综述原文：arXiv:1901.03407摘要异常检测是一个重要的问题，在不同的研究领域和应用领域都得到了很好的研究。本文的研究目的有两个：首先，我们对基于深度学习的异常检测

2021-07-12 07:10:19

基于YOLOX目标检测算法的改进

系统的关键任务之一，其主要的功能是检测前方道路上出现的目标的空间位置和目标类别。传统目标检测算法依赖于手工设计好的特征来对目标进行特征提取，以实现分类和检测的目的，常见的目标特征包括 Scale

2023-03-06 13:55:27

异常检测的深度学习：一项调查（翻译）精选资料分享

摘要异常检测是一个重要的问题，在不同的研究领域和应用领域都得到了充分的研究。本调查的目的有两个方面，首先我们对基于深度学习的异常检测的研究方法进行了结构化和全面的概述。此外，我们回顾了这些方法在

2021-07-12 08:05:13

机器学习简介与经典机器学习算法人才培养

经典机器学习算法介绍章节目标：机器学习是人工智能的重要技术之一，详细了解机器学习的原理、机制和方法，为学习深度学习与迁移学习打下坚实的基础。二、深度学习简介与经典网络结构介绍神经网络简介神经网络组件简介

2022-04-28 18:56:07

计算机视觉应用深度学习

怎样从传统机器学习方法过渡到深度学习？

2021-10-14 06:51:23

迁移学习

2022-04-21 15:15:11

龙哥手把手教你学视觉-深度学习YOLOV5篇

可以实现理想的检测效果。在本套视频，有别于常见的深度学习教程以理论为主进行全面讲解，以没有任何深度学习理论基础的学员学习角度，以实际应用为目标，讲解如何设计一个完整的yolov5工业外观检测，手把手教学

2021-09-03 09:39:28

基于帧间差分方法的道路车辆检测系统

为了智能监控道路车流量，本文应用帧间差分方法建立了适用于公路环境的机器视觉系统。系统所用方法可以自动识别视频场景内所有移动车辆，计算每个目标的位置、面积，统

2009-09-12 15:40:53

[14.4.1]--学习视频-基于正交投影的雷达小目标检测_clip001

目标检测

jf_75936199发布于 2023-03-09 10:58:27

[14.4.1]--学习视频-基于正交投影的雷达小目标检测_clip002

目标检测

jf_75936199发布于 2023-03-09 10:59:08

机器学习经典算法-最优化方法

机器学习算法之最优化方法

2017-09-04 10:05:10

基于深度学习的安卓恶意应用检测

和动态特征生成应用程序的特征向量；然后，使用深度学习算法中的深度置信网络（ DBN）对收集到的训练集进行训练，生成深度学习网络；最后，利用生成的深度学习网络对待测安卓应用程序进行检测。实验结果表明，在使用相同测试集的情况下

2017-12-01 15:04:27

基于深度学习的图片中商品参数识别方法

计算机计算性能的提升使得深度学习成为了可能．作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业，受限于网络的复杂度和检测算法的设计。目标检测的速度和精度成为

2017-12-15 10:15:02

深度学习中最核心的问题之一：训练数据

今天我们将讨论深度学习中最核心的问题之一：训练数据。深度学习已经在现实世界得到了广泛运用，例如：无人驾驶汽车，收据识别，道路缺陷自动检测，以及交互式电影推荐等等。

2017-12-25 10:34:28

10255

一种新的目标分类特征深度学习模型

为提高低配置计算环境中的视觉目标实时在线分类特征提取的时效性和分类准确率，提出一种新的目标分类特征深度学习模型。根据高时效性要求，选用分类器模型离线深度学习的策略，以节约在线训练时间。针对网络深度

2018-03-20 17:30:42

基于深度自编码网络的慢速移动目标检测

自编码网络算法，在时频域提取针对目标的深度抽象信息进行目标检测，以准确感知环境变化。仿真结果表明，与支持向量机、超限学习机和后向传播神经网络等传统机器学习相比，该方法可以有效感知环境变化，具有较高的鲁棒性和

2018-03-29 11:29:40

人工智能深度学习目标检测的详细资料免费下载

　本文档的主要内容详细介绍的是人工智能深度学习目标检测的详细资料包括了：RCNN，Fast RCNN ，Faster RCNN ，YOLO，SSD

2018-08-08 17:55:14

基于深度学习模型的点云目标检测及ROS实现

近年来，随着深度学习在图像视觉领域的发展，一类基于单纯的深度学习模型的点云目标检测方法被提出和应用，本文将详细介绍其中一种模型——SqueezeSeg，并且使用ROS实现该模型的实时目标检测。

2018-11-05 16:47:29

17181

如何使用深度学习进行视频行人目标检测

近年来，随着深度学习在计算机视觉领域的广泛应用，基于深度学习的视频运动目标检测受到广大学者的青睐。这种方法的基本原理是利用大量目标样本数据训练一个基于深度神经网络的分类器，然后通过分类器在线检测目标

2018-11-19 16:01:44

如何使用深度学习进行虚拟边界检测的方法

对VGGNet深度学习模型进行了简化，并在模型训练过程中采用了dropout以及Adam算法等优化策略。VBN以图像中每个像素为中心所取的图像块作为输入，然后输出该图像块所属的类别并据此判断中心像素是否属于虚拟边界。在对两类材料图像进行虚拟边界检测的

2018-11-19 16:16:40

深度学习优化器方法及学习率衰减方式的详细资料概述

下降、Adagrad、RMSProp、Adadelta、Adam、Nadam、ANGD等优化方法，也对学习率的衰减方式有分段常数衰减、多项式衰减、指数衰减、自然指数衰减、余弦衰减、线性余弦衰减、噪声线性余弦衰减等方法进行了总结，对深度学习现阶段存在的问

2018-12-18 16:47:50

如何基于深度学习的复杂气象条件下海上船只检测

为了解决复杂海情环境下的不同种类和大小的舰船检测问题，提出一种实时的深度学习的目标检测算法。首先，提出了一种清晰图片和模糊图片（雨、雾等图片）判别的方法；然后，在YOLO v2的深度学习框架的基础上

2018-12-19 17:08:46

探究深度学习在目标视觉检测中的应用与展望

目标视觉检测是计算机视觉领域的一个重要问题，在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来，深度学习在图像分类研究中取得了突破性进展，也带动着目标视觉检测取得突飞猛进的发展。

2019-01-13 10:59:23

5482

深度学习想变革安防行业首先要补齐深度学习的短板

目标识别、物体检测、智能分析……随着深度学习算法的进步，安防技术取得了突破性进展。深度学习被看做安防行业的革命性力量，大大加速了安防的发展过程。

2019-12-19 09:32:57

495

晶心科技和Deeplite携手合作高度优化深度学习模型解决方案

晶心科技今日宣布将携手合作，在基于AndeStar™ V5架构的晶心RISC-V CPU核心上配置高度优化的深度学习模型，使AI深度学习模型变得更轻巧、快速和节能。

2019-12-31 16:30:11

1002

深度学习中多种优化算法

在深度学习中，有很多种优化算法，这些算法需要在极高维度（通常参数有数百万个以上）也即数百万维的空间进行梯度下降，从最开始的初始点开始，寻找最优化的参数，通常这一过程可能会遇到多种的情况

2020-08-28 09:52:45

2268

基于深度学习的目标检测技术比作一场“热兵器革命”

从应用的角度来看，目标检测可以被分为两个研究主题：“ 通用目标检测(General Object Detection) ” 及 “检测应用(Detection Applications)” ，前者

2020-08-28 10:59:29

1877

GPU引领的深度学习

早期的机器学习以搜索为基础，主要依靠进行过一定优化的暴力方法。但是随着机器学习逐渐成熟，它开始专注于加速技术已经很成熟的统计方法和优化问题。同时深度学习的问世更是带来原本可能无法实现的优化方法。本文

2021-02-26 06:11:43

新型基于深度学习的目标实时跟踪算法

　　针对基于深度学习的目标跟踪算法模型参数多、难以部署于嵌入式设备上的问题，提出一种改进的孪生卷积网络实时目标跟踪算法。设计一个非对称卷积模块来构建整个网络框架，通过非对称卷积模块的压缩层减少模型

2021-03-11 10:41:04

深度学习模型的对抗攻击及防御措施

深度学习作为人工智能技术的重要组成部分，被广泛应用于计算机视觉和自然语言处理等领域。尽管深度学习在图像分类和目标检测等任务中取得了较好性能，但是对抗攻击的存在对深度学习模型的安全应用构成了潜在威胁

2021-03-12 13:45:53

一种基于深度学习的焊点位置检测方法

大及鲁棒性差的问题，提出一种基于深度学习的焊点位置检测方法。引入 Mobilenetv2的卷积结构代替 YOLOV2的卷积层，并借鉴YOLOⅴ2的细粒度特征的方法，解决YOLOⅴ模型参数较多的问题。采用 Glou loss对模型的损失函数进行改进，利用K- means聚类算法得到适合焊

2021-03-17 11:18:01

基于深度学习的显著性目标检测的数据集和评估准则

介绍并给出了显著性图，同时对三种类型方法进行了定性分析比较;然后简单介绍了基于深度学习的显著性目标检测常用的欻据集和评估准则;接着对所提基于深度学习的昰著性目标检测方法在多个数据集上进行了性能比较，包括定量比较、

2021-04-01 14:58:13

深度模型中的优化与学习课件下载

2021-04-07 16:21:01

一种多通道自编码器深度学习的入侵检测方法

　　针对现有的入侵检测方法在检测准确率和误报率方面存在的不足，提岀了一种多通道自编码器深度学习的入侵检测方法。该方法分为无监督学习和有监督学习两个阶段：首先分别采用正常流量和攻击流量训练两个独立

2021-04-07 15:23:59

一种基于深度学习的船舶检测方法

针对复杂海情下需要对不同大小及种类的船舶进行检测的问题，提岀一种基于深度学习的船舶检测方法，该方法主要针对区域全卷积网络（R-FCN）进行改进。首先选取 Resnet50网络用于自动提取特征，并将

2021-04-13 10:50:09

解析在目标检测中怎么解决小目标的问题？

导读本文介绍了一些小目标物体检测的方法和思路。在深度学习目标检测中，特别是人脸检测中，由于分辨率低、图像模糊、信息少、噪声多，小目标和小人脸的检测一直是一个实用和常见的难点问题。然而，在过去几年

2021-04-26 14:13:58

5926

基于深度学习的目标检测算法

整体框架目标检测算法主要包括：【两阶段】目标检测算法、【多阶段】目标检测算法、【单阶段】目标检测算法什么是两阶段目标检测算法，与单阶段目标检测有什么区别？两阶段目标检测算法因需要进行两阶

2021-04-30 10:22:04

10070

OpenCV使用深度学习做边缘检测的流程

导读分析了Canny的优劣，并给出了OpenCV使用深度学习做边缘检测的流程。在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的边缘检测，它比目前流行的canny边缘检测器更精

2021-05-08 11:05:30

1923

一文带你了解水下目标检测方法

与水下目标检测相关，如近期正在进行的2021全国水下机器人大赛，接下来我们将介绍在水下目标检测领域的深度学习方法概述。 01 水下目标检测的关键问题 1.1 水下图片模糊在水下场景中，由于光照影响大大降低了水下图像的质量

2021-05-11 15:43:48

10467

深度学习为传统视觉检测带来希望

，模仿人脑的机制来解释数据，例如图像，声音和文本。当理论与技术日趋成熟，深度学习的应用领域也不断扩张，那么在视觉检测领域，深度学习又带来了哪些影响呢？国辰机器人便来与大家聊一聊。

2021-06-17 10:32:02

438

解读目标检测中的框位置优化

为anchor-based（Faster RCNN）、anchor-free（CornerNet）的方法。本文主要从目标框位置优化的角度来介绍目标检测领域的相关工作。框位置优化主要可以分为以下几个

2021-06-21 17:40:11

2238

基于深度学习的道路表面裂缝检测技术

2021-07-05 16:30:30

基于深度学习的目标检测研究综述

基于深度学习的目标检测研究综述来源：《电子学报》，作者罗会兰等摘要：目标检测是计算机视觉领域内的热点课题，在机器人导航、智能视频监控及航天航空等领域都有广泛的应用.本文首先综述了目标检测

2022-01-06 09:14:58

1702

基于深度卷积神经网络的目标检测研究

检测并获得更好的性能是一项重要的研究。首先回顾和介绍了几类经典的目标检测算法;然后将深度学习算法的产生过程作为切入点，以系统的方式全面概述了各种目标检测方法;最后针对目标检测和深度学习算法面临的重大挑战，讨论了一些未来的方向，以促进深度学习对目标检测的研究。

2022-02-11 08:51:11

1144

基于深度学习的三种目标检测方法

目标检测是计算机视觉的一个非常重要的核心方向，它的主要任务目标定位和目标分类。

2022-04-06 14:56:38

6269

基于深度学习的小样本墙壁缺陷目标检测及分类

近年来，无需人工干预的深度学习已经成为缺陷图像检测与分类的一种主流方法。本文针对室内墙壁缺陷缺检测中数据集大多是小样本的问题，提出了相关的深度学习研究方法。首先，自制墙壁表面缺陷数据集（Wall

2022-04-24 09:44:16

通过利用深度学习对道路损坏进行检测分析

　　道路基础设施是一项重要的公共资产，因为它有助于经济发展和增长，同时带来重要的社会效益。路面检查主要基于人类的视觉观察和使用昂贵机器的定量分析。这些方法的最佳替代方案是智能探测器，它使用记录的图像

2022-07-06 09:35:14

1021

基于深度学习的工业缺陷检测方法

基于深度学习的工业缺陷检测方法可以降低传统人工质检的成本, 提升检测的准确性与效率, 因而在智能制造中扮演重要角色, 并逐渐成为计算机视觉领域新兴的研究热点之一. 其被广泛地应用于无人质检、智能巡检

2022-07-30 14:41:05

2220

使用深度学习的好处和优势

深度学习型图像分析较适合原本复杂的涂装表面检测：有微小变化但可接受的图案，以及无法使用空间频率方法排除的位置变量。深度学习擅长解决复杂的表面和涂装缺陷，例如转动、刷涂或发亮部件上的挂擦和凹痕。

2022-09-01 09:40:25

9078

AgriAI：使用深度学习的植物害虫检测

电子发烧友网站提供《AgriAI：使用深度学习的植物害虫检测.zip》资料免费下载

2022-10-21 09:33:07

深度学习在目标检测中的应用

R-CNN 算法在 2014 年提出，可以说是历史性的算法，将深度学习应用于目标检测领域，相较于之前的目标检测方法，提升多达 30% 以上

2022-10-31 10:08:05

1143

玩嗨OpenHarmony：基于OpenHarmony的道路维护方案

、有抵御灾害能力和可持续的城市和人类住区中的交通问题，在此提出一种基于OpenHarmony实现道路维护的方案，通过深度学习的方式对道路的裂缝进行实时检测，增加道路的可持续使用性。由于传统的道路裂缝检测精度和距离有限，大部分仍需要人工检测，而人工裂缝检测的过程又十分的繁琐

2022-11-02 21:20:05

924

基于MobileNet的多目标跟踪深度学习算法

针对深度学习算法在多目标跟踪中的实时性问题, 提出一种基于MobileNet的多目标跟踪算法. 借助于MobileNet深度可分离卷积能够对深度网络模型进行压缩的原理, 将YOLOv3主干网络替换

2022-11-09 10:23:30

736

使用深度学习的在线学习中的错误发音检测

　　以正确的方式发音是最难获得的技能之一，全球的研究人员正专注于使用机器/深度学习技术检测发音错误。在线学习中错误发音检测的目的是高精度地识别发音错误或缺陷，并提供指导性反馈以改善发音。

2022-11-29 12:10:26

526

基于深度学习的复杂背景下目标检测

目标检测是计算机视觉领域的重要研究方向. 传统的目标检测方法在特征设计上花费了大量时间, 且手工设计的特征对于目标多样性的问题并没有好的鲁棒性, 深度学习技术逐渐成为近年来计算机视觉领域的突破口

2022-12-01 10:00:01

534

基于深度学习的目标检测方法

为验证本文算法对不同大小目标的检测精度, 实验中随机选取100张图片, 其中包含198个目标, 将其分为大、中、小三类. 由于该网络的输入图像尺寸为300××300, 将图像中的检测目标按照其面积占图像总面积的比例分为三类。

2022-12-05 12:20:54

974

什么是深度学习中优化算法

先大致讲一下什么是深度学习中优化算法吧，我们可以把模型比作函数，一种很复杂的函数：h(f(g(k(x))))，函数有参数，这些参数是未知的，深度学习中的“学习”就是通过训练数据求解这些未知的参数。

2023-02-13 15:31:48

1019

一文梳理缺陷检测的深度学习和传统方法

但由于缺陷多种多样，传统的机器视觉算法很难做到对缺陷特征完整的建模和迁移，所以越来越多的学者和工程人员开始将深度学习算法引入到缺陷检测领域中。

2023-02-13 15:39:57

879

简述深度学习的基准目标检测及其衍生算法

基于深度学习的目标检测方法根据有无区域提案阶段划分为区域提案检测模型和单阶段检测模型

2023-02-27 15:31:49

814

GPU引领的深度学习

早期的机器学习以搜索为基础，主要依靠进行过一定优化的暴力方法。但是随着机器学习逐渐成熟，它开始专注于加速技术已经很成熟的统计方法和优化问题。同时深度学习的问世更是带来原本可能无法实现的优化方法。本文将介绍现代机器学习如何找到兼顾规模和速度的新方法。

2023-05-09 09:58:33

540

深度学习编译器之Layerout Transform优化

继续深度学习编译器的优化工作解读，本篇文章要介绍的是OneFlow系统中如何基于MLIR实现Layerout Transform。

2023-05-18 17:32:42

389

PyTorch教程12.1之优化和深度学习

电子发烧友网站提供《PyTorch教程12.1之优化和深度学习.pdf》资料免费下载

2023-06-05 15:08:41

PyTorch教程-12.1. 优化和深度学习

目标上的标志。 12.1.1。优化目标¶ 尽管优化为深度学习提供了一种最小化损失函数的方法，但从本质上讲，优化和深度学习的目标是根本不同的。前

2023-06-05 15:44:30

327

自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战

了许多解决深度多模态感知问题的方法。然而，对于网络架构的设计，并没有通用的指导方针，关于“融合什么”、“何时融合”和“如何融合”的问题仍然没有定论。本文系统地总结了自动驾驶中深度多模态目标检测和语义分割的方法，

2023-06-06 10:37:11

如何学习基于Tansformer的目标检测算法

，也是近年来理论研究的热点。作为计算机视觉中的基础算法，目标检测对后续的人脸识别、目标跟踪、实例分割等任务都起着至关重要的作用。基于深度学习的卷积学习网络（CNN）在目标检测任务上取得了优越的性能，例如FasterRCNN、

2023-06-25 10:37:48

357

基于强化学习的目标检测算法案例

摘要：基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为，其产生的候选区域形状和尺寸变化单一，导致目标检测精确度较低。为此，在基于深度强化学习的视觉目标检测算法基础上，提出联合回归与深度

2023-07-19 14:35:02

基于深度学习的点云分割的方法介绍

　　摘要：点云分割是点云数据理解中的一个关键技术，但传统算法无法进行实时语义分割。近年来深度学习被应用在点云分割上并取得了重要进展。综述了近四年来基于深度学习的点云分割的最新工作，按基本思想分为

2023-07-20 15:23:59

深度学习的由来深度学习的经典算法有哪些

深度学习作为机器学习的一个分支，其学习方法可以分为监督学习和无监督学习。两种方法都具有其独特的学习模型：多层感知机、卷积神经网络等属于监督学习；深度置信网、自动编码器、去噪自动编码器、稀疏编码等属于无监督学习。

2023-10-09 10:23:42

303

深度学习在工业缺陷检测中的应用

工业制造领域中，产品质量的保证是至关重要的任务之一。然而，人工的检测方法不仅费时费力，而且容易受到主观因素的影响，从而降低了检测的准确性和一致性。近年来，基于深度学习的技术在工业缺陷检测领域取得了显著的突破，其凭借其出色的特征学习和自动化能力，逐渐成为工业缺陷检测的热门方向。

2023-10-24 09:29:27

478

深度学习在植物病害目标检测研究进展

植物病害准确检测与识别是其早期诊断与智能监测的关键，是病虫害精准化防治与信息化管理的核心。深度学习应用于植物病害检测与识别中，可以克服传统诊断方法的弊端，大幅提升病害检测与识别的准确率，引起了广泛

2023-11-20 17:19:42

247

已全部加载完成

搜索历史

基于深度学习的道路小目标检测优化方法

评论