双向特征融合的数据自适应SAR图像舰船目标检测模型

人工智能技术与咨询昨天

本文来自《中国图象图形学报》，作者张筱晗等

关注微信公众号：人工智能技术与咨询。了解更多咨询！

摘要：利用合成孔径雷达（synthetic aperture radar，SAR）图像进行舰船目标检测是实施海洋监视的重要手段。基于深度学习的目标检测模型在自然图像目标检测任务中取得了巨大成功，但由于自然图像与SAR图像的差异，不能将其直接迁移到SAR图像目标检测中。针对SAR图像目标检测实际应用中对速度和精度的需求，借鉴经典的单阶段目标检测模型（single shot detector，SSD）框架，提出一种基于特征优化的轻量化SAR图像舰船目标检测网络。方法改进模型并精简网络结构，提出一种数据驱动的目标分布聚类算法，学习SAR数据集的目标尺度、长宽比分布特性，用于网络参数设定；对卷积神经网络（convolutional neural network，CNN）提取的特征进行优化，提出一种双向高低层特征融合机制，将高层特征的语义信息通过语义聚合模块加成到低层特征中，在低层特征中提取特征平均图，处理后作为高层特征的注意力权重图对高层特征进行逐像素加权，将低层特征丰富的空间信息融入到高层特征中。结果利用公开的SAR舰船目标检测数据集（SAR ship detection dataset，SSDD）进行实验，与原始的SSD模型相比，轻量化结构设计在不损失检测精度的前提下，样本测试时间仅为SSD的65%；双向特征融合机制将平均精确度（average precision，AP）值由77.93%提升至80.13%，训练和测试时间分别为SSD的64.1%和72.6%；与公开的基于深度学习的SAR舰船目标检测方法相比，本文方法在速度和精度上都取得了最佳性能，AP值较精度次优模型提升了1.23%，训练和测试时间较精度次优模型分别提升了559.34 ms和175.35 ms。结论实验充分验证了本文所提模型的有效性，本文模型兼具检测速度与精度优势，具有很强的实用性。

舰船目标检测是实施海洋监视的重要环节，在军事侦察、海洋运输管理、海上犯罪打击等领域都有着重要应用(Allard等，2008)。得益于全天时、全天候的优势，合成孔径雷达(synthetic aperture radar，SAR)图像成为一种有效的舰船目标遥感数据源，SAR舰船目标检测得到了广泛研究。传统的基于海杂波建模思想的SAR舰船检测方法通常针对某一场景进行建模(Dalal和Triggs，2005；Agrawal等，2015；Pappas等，2018)，无法同时兼顾多类应用场景。而基于数据驱动的深度学习目标检测方法则不受场景影响，只要提供充足多样的数据，即可训练深度网络自动提取图像特征，实现目标检测。

得益于计算机技术与人工智能技术的发展，在计算机视觉领域，基于深度学习的目标检测方法取得了很多检测任务的最佳性能。经典的目标检测模型，包括以Faster RCNN(region convolutional neural network)(Ren等，2017)为代表的双阶段检测模型、以YOLO(you only look once)(Redmon等，2015)和SSD(single shot multi-box detector)(Liu等，2016)为代表的单阶段检测模型都被引入到SAR舰船检测中。与传统方法相比，这些模型多是端到端的，并且在精度和泛化能力上有了很大提升。但是，将这些模型从自然图像目标检测迁移到SAR舰船目标检测时仍面临着一些问题:1)这些模型参数，如网络层数和锚框设置多是针对Pascal VOC(visual object classes)(Everingham等，2015)和MS COCO(Lin等，2014)等自然图像数据集设定的，而这些设置未必适合SAR舰船数据; 2)数据量相对较小的检测数据集往往不足以从头训练规模较大的检测模型，通常做法是在检测模型初始化时，将特征提取部分直接载入大型自然图像分类数据集(如ImageNet等)预训练好的模型参数，然后使用检测数据集进行微调; 3)分类任务与检测任务、自然分类数据集与SAR目标检测数据集存在偏差; 4)SAR图像自身的一些特点给检测增加了难度，如受空间分辨率与成像机理影响，图像中舰船目标细节信息少，各类舰船尺度不一、分布各异等。在设计SAR舰船目标检测模型时, 要考虑这些问题。Kang等人(2017)和Yang等人(2018)根据使用的遥感舰船数据重新设置了检测模型参数。Deng等人(2019)利用密集连接网络作为特征提取网络，并采用了特征重用等策略，可以从头训练。为了提升SAR舰船目标检测的精度，学者利用多种方式对网络提取的特征进行优化，其中，特征融合是一项常用策略(Jiao等，2018；Zhang等，2019)。自从Lin等人(2017)提出特征金字塔网络(feature pyramid network，FPN)，其高低特征层融合的思想大量用于多种模型。卷积神经网络(convolutional neural network, CNN)在提取特征过程中，随着网络层数的加深与池化层的应用，深特征层有着更大的感受野，能够提取出更多抽象的全局语义特征，而浅层特征空间信息更加丰富。为弥补浅层特征语义信息的不足，将高层特征处理后加入到浅层特征。Wang等人(2018)将FPN中的语义聚合策略应用在SAR舰船检测中，与原始的SSD模型相比，显著提升了舰船检测精度。Kang等人(2017)将浅层特征、中层特征与高层特征都融合起来，输入到Faster RCNN模型。特征融合的策略能够提升模型性能，但也增加了运算量，此外，大部分融合模型的融合通道是由上至下的，没有考虑高层信息中空间信息的不足。

针对上述问题，本文对SAR图像舰船目标检测进行研究，针对SAR图像的特点改进了经典检测模型SSD，同时提升了目标检测的速度和精度。本文工作包括两部分：1)根据SAR数据的特点，精简了SSD模型结构，提出了一种数据集目标特性聚类算法，用于指导网络参数的设置；2)借鉴特征融合思想，提出一种双向特征融合机制，除了利用语义聚合增强浅层特征的语义信息，同时设计了一种新的基于注意力机制的融合方法，将浅层特征丰富的空间信息加成到高层特征。前者主要改进模型适应SAR舰船检测任务，后者进一步优化模型，提升检测精度。在公开SAR舰船目标检测数据集SSDD(SAR ship detection dataset)(Li等，2017)上的实验充分验证了本文方法的有效性。

1 LSSD检测模型

1.1 模型结构

本文模型是在经典的SSD模型基础上改进的，并以VGG-16(visual geometry group 16)作为特征提取网络。标准的SSD-300模型(输入图像大小为300 × 300 × 3)保留了VGG-16的前5个卷积单元，去掉全连接层，并继续在后面连接了6个卷积单元，最终卷积单元输出的特征图空间维变成1×1。但是，对SAR图像来说，某种极化模式下获取的图像是单通道的。在使用通用检测模型时，通常做法是将单通道SAR图像扩展为3通道作为输入，这种做法增加了网络的冗余信息。此外，SAR遥感图像中的舰船目标尺度变化很大，所占像素从几个到几百不等，但受空间分辨率影响，单个舰船目标通常不会占满图像(300 × 300像素标准输入大小)。因此，对模型进行更改，直接以单通道图像作为输入，去掉SSD模型的后3个卷积模块，并将全部卷积层的通道维减半。这样，与SSD相比，网络需要训练的参数量少于原来的1/4，模型显著变轻量化，将其命名为LSSD(lightweight SSD)。经验证，即使是较小的检测数据集如SSDD也可以从头训练LSSD，使其不必依赖于分类任务预训练模型。借鉴SSD模型的设置，同时考虑SAR图像中的小舰船目标，选取conv3_3、conv4_3、conv7、conv8输出的特征图输入到检测器中进行后续检测。

本文模型整体框架如图 1所示，图中右侧为LSSD网络的具体设置，图中S代表语义聚合，A代表注意力引导的融合。

图 1 本文模型框架图

Fig. 1 Framework of proposed model

1.2 基于聚类算法的数据集目标特性统计

与Faster RCNN和SSD模型相同，LSSD也是基于锚框(anchor)实施检测。锚框的设置包括尺度和比例，能够反映数据集中目标的尺度和比例分布特性，对网络检测性能具有重要影响。受YOLOv2(Redmon和Farhadi，2017)中的维度聚类算法启发，本文设计了一种基于聚类的目标特性分布自动学习算法，具体内容以SSDD数据集为例进行说明。

假设图像大小为M×NM×N，舰船目标检测框大小为w×hw×h。目标尺度ss和长宽比rr的定义为

s=w×hM×Ns=w×hM×N

(1)

r=whr=wh

(2)

1) 学习数据集中舰船目标的尺度分布。假设数据集中所有舰船目标的尺度集合为S:{s1,s2,…,sk}S:{s1,s2,…,sk}，设定kk个尺度聚类中心U:{μ1,μ2,⋅⋅⋅,μk}U:{μ1,μ2,···,μk}，其中μiμi初值为[0,1][0,1]区间的随机值，μ1μ1到μkμk从小到大排列。通过最小化目标各尺度与聚类中心欧氏距离之和dsds，以更新UU的参数，即

minds=∑i=1n∥si−μj∥2minds=∑i=1n‖si−μj‖2

(3)

式中，j∈{1,2,⋅⋅⋅,k}j∈{1,2,···,k}，μjμj为最接近sisi的聚类中心。每次迭代中，μjμj更新为以其为聚类中心的所有目标尺度的均值，不断迭代直到dsds小于设定阈值。迭代完成后，将学习到的尺度聚类中心UU分配到合适的特征层中，较小的尺度分配给低的特征层，大的锚框尺度则分配给高特征层。

2) 学习数据集中舰船目标的长宽比分布特性。设定特征层lxlx的长宽比聚类中心个数为gg，尺度接近该层各尺度聚类中心的舰船目标长宽比构成集合Rx:{rx1,rx2,…}Rx:{rx1,rx2,…}，gg个长宽比聚类中心构成集合Vx:{τ1,τ2,…,τg}Vx:{τ1,τ2,…,τg}，τiτi初值设为随机正数，通过最小化目标长宽比到各自聚类中心欧氏距离之和drsdrs进行优化，即

mindrs=∑xi=1nx∥rxi−τj∥2mindrs=∑xi=1nx‖rxi−τj‖2

(4)

式中，j∈{1,2,…,g}j∈{1,2,…,g}，τjτj为最接近rxirxi的长宽比聚类中心。每次迭代中，τjτj更新为聚类中心目标长宽比的均值。不断进行迭代，直到drsdrs小于设定阈值。最后根据长宽比聚类中心的值设置该层锚框的长宽比参数。

2 基于双向融合的特征优化

2.1 原理分析

卷积神经网络提取的分层特征有着不同的特点。与SSD一样，为检测多尺度目标，LSSD也使用了多层特征。其中浅层特征通常包含更多目标细节信息，缺乏高级语义信息; 深层特征信息更加抽象，但缺乏空间位置信息。以FPN网络为代表的从上到下的语义聚合的特征融合方式已经得到了广泛应用，针对如何将浅层丰富的空间信息传递到深特征层，本文提出了基于注意力机制的融合方式。

为直观理解CNN提取的特征，本文将训练好的LSSD模型中不同层的特征进行可视化。图 2是训练好的LSSD模型提取的两幅SAR图像conv3_3、conv4_3、conv7、conv8的第1通道和第64通道的特征图及各通道平均热力图。可以看出，针对输入的特定图像，不同卷积层在不同通道提取了不同特征，但很难解释特定通道特征的含义。为展示每个卷积层提取的整体特征，在特征层通道维进行全局平均池化，得到特征的空间维平均图，并以热图的形式展示。从平均图可以看出，随着特征层的增深，平均特征中关于目标的表征越来越抽象。其中，在conv4_3的特征平均图中，无论背景是较为简单的水面，还是更复杂的陆地，舰船目标与背景分离最明显。受计算机视觉中注意力机制(Woo等，2018)启发，将conv4_3特征平均图视为空间注意力显著图，指导网络更关注的位置。可以直接利用conv4_3特征平均图作为权重图，去对其余更深的特征层进行加权，以这种方式将低特征层的目标位置信息传递到更深的特征层中，实现特征自下而上的融合。

图 2 训练好的LSSD模型从SAR图像提取的特征图

Fig. 2 Feature maps extrac ted by our trained model from SAR image

((a) original images; (b) conv3_3; (c) conv4_3; (d) conv7; (e) conv8)

2.2 特征双向融合实施流程

采用的双向特征融合操作流程如图 3所示。首先进行自上而下的语义聚合，然后实施注意力机制引导下的自下而上的特征融合。语义聚合模型(图 3(a))主要包括深层特征上采样、特征图通道维串联以及1×1卷积修正通道数等过程，最终融合特征与浅层特征在空间维和通道维的尺寸相同。基于注意力引导的特征融合模块如图 3(b)所示，来自conv4_3的特征图在通道维进行平均池化，得到大小为pp的平均特征图FF，作为融合中的注意力图。FF通过sigmoid函数进行归一化，得到注意力权重图，具体计算为

F(x)=11+e−xF(x)=11+e−x

(5)

图 3 特征融合算法流程图

Fig. 3 Framework of our feature fusion module

((a) semantic aggregation block; (b) attention guided fusion block)

式中，xx代表FF中各像素值，F(x)∈(0,1)F(x)∈(0,1)。该权重图被用来对其余特征层进行加权。融合前，需要通过下采样等方式将权重图的大小改为高层特征图的空间大小，然后对高层特征的每个通道的特征图进行逐元素相乘的操作，得到融合特征图。注意该操作只自下而上进行，conv4_3特征图得到的注意力权重图不再影响conv3_3。

3 实验与结果分析

对本文方法利用公开的SSDD数据集进行实验，首先利用基于聚类的数据集目标特性统计方法指导的网络参数设置与原SSD网络参数设置进行对比，然后逐步对比本文方法每一模块的效果，最后将本文方法与其他SAR舰船目标检测的方法进行对比。

3.1 数据集说明与实验设置

SSDD数据集是国内第1个公开的SAR舰船目标检测数据集，包含1 160幅图像与2 456个舰船实例。实验平台操作系统为64位单GTX 1080Ti GPU计算机，操作系统为Ubuntu 16.06，编程语言为Python，使用的深度学习框架为TensorFlow，并使用CUDA9.0与cuDNN7.0加速。训练次数设为12万次，前2万次初始学习率为0.000 1，接下来6万次学习率设为0.000 01，最后4万次学习率设为0.000 001。训练中，批次容量设为24，使用momentum训练优化器。

为评价测试结果，采用精确率(precision)、召回率(recall)以及平均精确率(average precision，AP)作为客观评价指标，指标的具体定义与Kang等人(2017)采用的定义相同。精确率和召回率是在交并比(intersection-over-union，IoU)阈值设为0.5、分类得分阈值设为0.2的情况下计算的。这些指标值越高，说明算法检测性能越好。此外，利用单幅图像的平均训练与测试时间衡量算法的运行速度。

3.2 实验结果

3.2.1 网络参数设置对检测结果的影响

实验采用两组参数设置在SSD模型上进行。一组为SSD原始参数，锚框采用SSD模型中的6层特征，如表 1所示；另一组为使用本文提出的基于聚类的数据集目标特性学习方法为指导的网络参数，锚框采用LSSD模型中的4层特征，如表 2所示。

表 1 采用SSD模型中6层特征的锚框参数
Table 1 Anchor settings of SSD in the 6 feature layers

卷积层	尺度	长宽比	额外尺度
conv4_3	0.1	1 :1, 1 :2, 2 :1	0.141 4
conv7	0.2	1 :1, 1 :2, 2 :1, 1 :3, 3 :1	0.273 9
conv8_2	0.375	1 :1, 1 :2, 2 :1, 1 :3, 3 :1	0.454 1
conv9	0.55	1 :1, 1 :2, 2 :1, 1 :3, 3 :1	0.631 5
conv10	0.725	1 :1, 1 :2, 2 :1	0.807 8
conv11	0.9	1 :1, 1 :2, 2 :1	0.983 6

表 2 采用LSSD模型中4层特征的锚框参数
Table 2 Anchor settings of LSSD in the 4 feature layers

卷积层	尺度	长宽比	额外尺度
conv3_3	0.005	1 :1, 1 :2, 2 :1	0.01
conv4_3	0.020	1 :1, 4 :7, 20 :11	0.04
conv7	0.060	1 :1, 4 :7, 3 :1, 1 :4, 20 :11	0.12
conv8_2	0.250	1 :1, 4 :7, 3 :1, 1 :4, 20 :11	0.40

两组实验除锚框设置不同外，其余实验条件均相同，实验结果如表 3所示。可以看出，锚框的参数设置对检测结果有很大影响。在其他条件不变的前提下，适合检测数据集的网络参数设置对挖掘模型的性能潜力非常重要。本文方法不受人为经验影响，完全基于数据集特性优化网络参数设置。

表 3 SSD模型采用不同锚框参数的检测结果
Table 3 Detection results of SSD with different anchors parameters

/%
参数	平均精确率	精确率	召回率
SSD中6层特征的锚框参数	76.95	86.35	87.00
LSSD中4层特征的锚框参数	78.03	89.15	88.80
注：加粗字体为每列最优结果。

3.2.2 模型简化实验

通过模型简化实验的方法验证所提轻量化设置、双向特征融合模块对检测结果的影响。将采用LSSD模型中4层特征的锚框参数设置的SSD模型作为比较的基准模型，与LSSD模型、结合了语义聚合的LSSD模型、结合了注意力引导融合的LSSD模型以及结合了双向特征融合方法的LSSD模型分别进行性能指标与速度指标的对比，结果如表 4所示。可以看出，与SSD模型相比，本文提出的LSSD模型在速度方面具有显著优势，测试时间仅为SSD模型的65%，而检测精度与SSD模型基本一致。语义聚合和注意力引导特征融合都可以提高检测的精度，而在训练和测试中，只增加了很少的时间。两个模块的组合在精度方面实现了最佳性能，平均精确率与SSD相比提高了2.1%。

表 4 模型简化实验结果
Table 4 The testing results in ablation study

模型	语义聚合	注意力引导融合	平均精确率/%	精确率/%	召回率/%	训练时间/ms	测试时间/ms
SSD	-	-	78.03	89.15	88.80	20.79	14.02
LSSD	-	-	77.93	89.54	88.60	12.74	9.17
LSSD +语义聚合	√	-	78.68	94.55	88.00	13.01	9.72
LSSD +注意力引导融合	-	√	72.20	95.26	89.20	12.97	9.57
LSSD +双向特征融合	√	√	80.13	96.68	89.60	13.33	10.18
注：加粗字体为每列最优结果。“-”表示没有采用对应方法，“√”表示采用了该方法。

为进一步展示这些模型的检测结果，图 4给出了部分典型检测结果样例。可以看出，结合了双向特征融合模块的模型在提升召回率、减少虚警率等方面表现最佳，说明本文的融合方法是一种有效的特征优化方法。

图 4 不同方法部分检测结果样例图

Fig. 4 Some samples of detecting results using different methods((a) ground truths; (b) SSD; (c) LSSD; (d) LSSD with semantic aggregation module; (e) LSSD with attention fusion module; (f) LSSD with bi-directional fusion module)

3.2.3 与其他方法对比

为进一步验证本文方法的有效性与实用性，与Faster RCNN(Ren等，2017)、基于卷积神经网络的检测模型(CNN-based model)(李健伟等，2018)、基于生成对抗网络(generative adversarial network，GAN)和线上难例挖掘(online hard example mining，OHEM)的检测模型(李健伟等，2019)以及密集连接的端到端检测网络(densely connected end-to-end neural network)(Jiao等，2018)等模型进行对比实验，以上对比模型依次称为模型1、模型2、模型3、模型4，结果如表 5所示。

表 5 本文方法与其他舰船检测方法对比结果
Table 5 Detection results of different models for comparison

模型	平均精确率/%	精确率/%	召回率/%	训练时间/ms	测试时间/ms
模型1	73.24	92.31	88.80	540.42	159.11
模型2	78.90	93.10	86.40	572.67	185.53
模型3	70.24	82.01	78.40	2 152.09	330.78
模型4	77.84	95.21	83.60	561.82	180.95
本文	80.13	96.68	89.60	13.33	10.18
注：加粗字体为每列最优结果。

模型2和模型4都是基于Faster RCNN模型提出的，与Faster RCNN模型相比，它们提高了检测精度，同时也增加了平均训练和测试的时间。但是，与本文的单阶段检测方法相比，Faster RCNN在训练精度上并没有表现出太大优势，原因可能由于Faster RCNN系列结构更复杂，像SSDD这样的小型检测数据集无法很好地对其进行训练。模型3利用生成对抗网络和在线难例挖掘技术来扩大训练中的数据，并基于RCNN方法进行检测，不仅速度慢，而且精度也是几种方法中最低的。而本文方法在召回率和检测精度等方面都实现了最佳性能，并且在速度方面具有明显优势，反映出本文方法的有效性与实用性。

4 结论

本文主要研究SAR图像舰船目标检测，着重解决了检测中速度与精度的平衡问题。为了提高算法的处理速度，设计了轻量化的LSSD模型，与SSD模型相比，需训练的参数大幅减少，模型可从头开始训练而不必依赖预训练模型。为了提高模型检测的精度，提出了一种用于参数设置的基于聚类的目标分布特性学习算法，并采用语义聚合块和新的注意力引导融合块的双向特征融合模块来优化检测特征，改进了传统方法中单向特征融合不能优化高层特征的不足。利用公开的SSDD数据集验证了所提各模块的效果，结果表明，所提模型在速度和精度方面均表现出良好性能，与基准模型以及其他经典检测算法相比，训练和测试速度均有明显提升，检测精度也高于其他检测算法，从检测结果图中也可以看出，所提模型有效降低了目标漏检情况。

然而，尽管本文模型较其他检测模型表现出更好的速度和精度性能，但测试中仍存在一些失败案例，如无法较好地检测密集排列的舰船目标，这也是实验中各检测模型存在的普遍问题。其原因主要在于包括本文模型在内的这些模型都采用了垂直矩形边框作为目标边界框实施检测，而相邻的密集排列舰船目标的检测框存在大量重叠区域，容易被模型自动合并、删减，造成检测框位置不准确甚至漏检。而采用目标最小外接倾斜矩形框作为目标边界检测框可以有效避免这类问题。因此，在今后工作中，将继续研究基于目标倾斜边界框的检测算法，提高检测效果。此外，本文模型没有利用SAR图像的极化信息。如何利用SAR图像的极化信息提升检测性能也是接下来一个有意义的研究重点。

【转载声明】转载目的在于传递更多信息。如涉及作品版权和其它问题，请在30日内与本号联系，我们将在第一时间删除！

关注微信公众号：人工智能技术与咨询。了解更多咨询！

编辑：fqj

阅读全文

检测模型(7273) 检测模型(7273)
深度学习(119795) 深度学习(119795)

AMD 自适应计算技术助力索尼半导体解决方案激光雷达汽车参考设计

)参考设计。 SSS 作为图像传感器技术领域的全球领导者,此次与 AMD 携手带来用于自动驾驶汽车的强大且高效的激光雷达解决方案。采用 AMD 自适应计算

2024-03-20 20:28:15

149

请问ST25RU3993-HPEV的自适应防碰撞算法是在板子上面实现的吗？

请问ST25RU3993-HPEV的自适应防碰撞算法是在板子上面实现的？还是在STSW-ST25RU001上位机上面实现的？这个算法可否提供？STSW-ST25

2024-03-19 06:50:54

基于光子纠缠的自适应光学成像技术应用

对引导星的依赖给显微镜成像细胞和组织等不含亮点的样本带来了问题。科学家们利用图像处理算法开发了无引导星的自适应光学系统，但这些系统可能会因结构复杂的样本而失效。

2024-03-11 11:29:42

深度学习在偏振图像融合领域的研究进展与现状

基于多尺度变换（MST）的偏振图像融合方法研究开始较早且应用广泛。2016年，中北大学提出一种红外偏振与强度图像融合算法，融合结果能够保留红外强度图像的全部特征和大部分偏振图像的特征。

2024-03-11 11:17:33

161

什么是自适应光学？自适应光学原理与方法的发展

目前，世界上大型的望远镜系统都采用了自适应光学技术，自适应光学的出现为补偿动态波前扰动，提高光波质量提供了新的研究方向。 60多年来，自适应光学技术获得蓬勃发展，现已应用于天文学、空间光学、激光、生物医学等领域。

2024-03-11 10:27:35

艾为发布第三代自适应可编程SAR Sensor AW963xx系列

上海艾为电子技术股份有限公司（简称“艾为”）正式推出其第三代自适应可编程SAR Sensor——AW963xx系列。该系列传感器采用了先进的自互容一体电容感测技术，并内置了自适应补偿引擎，具备卓越的感知精度和强大的环境自适应补偿能力。

2024-02-27 14:12:04

157

红外与可见光图像融合方法综述

图像融合旨在将来自不同源图像的互补信息融合在一起，生成一幅具有更高质量、更多信息量和更清晰的图像。红外与可见光图像融合（IVIF）是图像融合领域的研究热点。

2024-02-22 09:35:34

388

视觉检测设备的分类

视觉检测设备是一种利用摄像头、传感器、光源和图像处理算法等技术组成的设备，用于检测、识别、分析和判断图像或视频中目标物体的特征、属性、状态或缺陷。这些设备可以应用于各种行业和领域，包括工业自动化

2024-02-21 09:41:11

164

TCP协议技术之自适应重传

自适应重传是TCP协议中的一种拥塞控制机制，旨在通过智能的方式处理网络拥塞，并进行相应的数据重传，以提高网络的可靠性和性能。

2024-02-03 17:03:29

762

Spring Boot和飞腾派融合构建的农业物联网系统-改进自适应加权融合算法

融合之前需用箱线图法检测和剔除异常值。箱线图法中反映数据结构的参数有：第一四分位数 Q1、第三四分位数 Q3以及四分位间距IQR。 2自适应加权融合算法为了确保参数估计的准确性和稳定性，本文

2024-01-06 12:18:08

微美全息（NASDAQ:WIMI）探索全局-局部特征自适应融合网络框架在图像场景分类中的创新运用

面临着许多挑战，如复杂的场景等。然而，现有的图像场景分类方法往往只关注全局或局部特征的提取，而忽略了全局和局部特征之间的互补关联。为了解决这些问题，微美全息(NASDAQ:WIMI)不断探索新的网络架构和算法，正在将全局

2024-01-05 16:08:37

143

如何搞定自动驾驶3D目标检测！

可用于自动驾驶场景下基于图像的3D目标检测的数据集总结。其中一些数据集包括多个任务，这里只报告了3D检测基准（例如KITTI 3D发布了超过40K的图像,其中约15K用于3D检测）。

2024-01-05 10:43:57

120

Versal自适应SoC系统集成和确认方法指南

电子发烧友网站提供《Versal自适应SoC系统集成和确认方法指南.pdf》资料免费下载

2024-01-03 10:48:57

创想焊缝跟踪系统在尔必地机器人自适应焊接中的应用案例

作为一种先进的焊接技术，在自适应焊接中发挥着关键作用，今天就来看下创想焊缝跟踪系统在自适应焊接的应用。焊缝跟踪系统原理创想焊缝跟踪系统是一种基于先进视觉和控制技术的智能焊接系统。其原理主要包括图像采集、

2024-01-02 17:37:46

189

OpenCV4图像分析之BLOB特征分析

BLOB是图像中灰度块的一种专业称呼，更加变通一点的可以说它跟我们前面二值图像分析的联通组件类似，通过特征提取实现常见的各种灰度BLOB对象组件检测与分离。使用该检测器的时候，可以根据需要输入不同参数，得到的结果跟输入的参数息息相关。

2023-12-28 12:28:10

297

SAR目标散射拓扑特性表征与识别应用

2022年4月11日，上海雷达同心学术论坛——雷达图像解译技术研讨会成功举办！中国科学院空天信息创新研究院孙显研究员4月11日在该研讨会上做了题为《SAR目标散射拓扑特性表征与识别应用》的学术报告。

2023-12-28 10:34:53

184

【飞腾派4G版免费试用】Spring Boot和飞腾派融合构建的农业物联网系统-数据融合算法篇

，在农田中使用多传感器融合检测将会是一个很好的方案。二、理论依据由于自适应加权融合算法在实际应用中具有融合速度快、不需要先验条件优点广泛应用于同质传感器融合中。加权融合算法原理图如下图所示

2023-12-26 20:59:02

CNN图像分类策略

在深度学习出现之前，自然图像中的对象识别过程相当粗暴简单：定义一组关键视觉特征（“单词”），识别每个视觉特征在图像中的存在频率（“包”），然后根据这些数字对图像进行分类。这些模型被称为“特征包”模型（BoF模型）。

2023-12-25 11:36:54

【飞腾派4G版免费试用】第三章：抓取图像，手动标注并完成自定义目标检测模型训练和测试

抓取图像，手动标注并完成自定义目标检测模型训练和测试在第二章中，我介绍了模型训练的一般过程，其中关键的过程是带有标注信息的数据集获取。训练过程中可以已有的数据集合不能满足自己的要求，这时候就需要

2023-12-16 10:05:19

【飞腾派4G版免费试用】第二章：在PC端使用 TensorFlow2 训练目标检测模型

本章记录了如何使用TensorFlow2 进行目标检测模型训练的过程。

2023-12-15 06:40:05

910

Versal 自适应SoC设计指南

电子发烧友网站提供《Versal 自适应SoC设计指南.pdf》资料免费下载

2023-12-14 16:22:36

基于机器视觉的SAR自聚焦方法研究

多源SAR图像指的是由不同雷达系统与飞行批次获得的图像，它们的雷达波段、分辨率、运动参数、场景类型和工作模式等均存在着较大差异。现有的SAR自聚焦理论与方法大都基于经典的“物理模型”或“统计模型”，在多源SAR图像情形下的普适性一般较差。

2023-12-02 10:36:21

196

LabVIEW开发自适应降噪ANC

LabVIEW开发自适应降噪ANC 在许多情况下，信号很嘈杂，必须消除噪声。自适应降噪（ANC）是可用于消除信号噪声的主要实时方法之一。可以使用LabVIEW自适应滤滤器工具包来设计ANC应用程序

2023-11-30 19:38:01

知语云:低慢小无人机如何反制管制监测行为？方式方法又是什么？

对无人机的探测在五百米范围内有良好效果。作为在一种辅助探测手段，声探测的融入是能够大大提高近距探测的响应速度和精度。图5融合探测模型多传感器信息融合是多层次的（图5），可以分为数据级融合、特征级融合

2023-11-20 17:07:59

GPS接收机信号之自适应降秩滤波算法

电子发烧友网站提供《GPS接收机信号之自适应降秩滤波算法.pdf》资料免费下载

2023-11-17 16:42:17

基于FPGA的自适应均衡器的研究与设计

电子发烧友网站提供《基于FPGA的自适应均衡器的研究与设计.pdf》资料免费下载

2023-11-07 10:33:28

自适应PID在单片机中怎样实现？

自适应PID在单片机中怎样实现？

2023-11-07 06:13:24

自适应巡航系统的组成及原理

在ACC系统中，测距雷达用于测量自车与前方车辆的车头距、相对速度、相对加速度，是自适应巡航控制系统中的关键设备之一，也是决定该系统造价的主要元件。其主要组成包括发射天线，接受天线，DPS（数字信号处理）处理单元，数据线等。

2023-11-01 09:55:16

457

如何使用质心法进行目标追踪--文末送书

TBD方法完整的流程如图2所示，该方法共有5个步骤，其中最关键的是“目标检测”和“目标关联”两个步骤，“目标检测”需要一个训练好的目标检测模型，用来发现图像中的各个目标，“目标关联”需要一个关联算法，用来进行目标的配对。

2023-10-31 15:47:21

270

机载雷达空时自适应处理技术

由于机载雷达的地物杂波呈现为空时二维耦合谱特性，这就决定了机载雷达杂波抑制基本属于空时二维滤波问题，而且，其二维处理需实时自适应实现，即杂波抑制需使用空时二维自适应处理(STAP)。

2023-10-26 14:35:33

694

汽轮机调速系统的非线性自适应控制

电子发烧友网站提供《汽轮机调速系统的非线性自适应控制.pdf》资料免费下载

2023-10-24 09:51:18

基于CPLD的相序自适应晶闸管数字触发器设计

电子发烧友网站提供《基于CPLD的相序自适应晶闸管数字触发器设计.pdf》资料免费下载

2023-10-18 10:08:32

基于LMS算法自适应噪声抵消器的分析研究

电子发烧友网站提供《基于LMS算法自适应噪声抵消器的分析研究.pdf》资料免费下载

2023-10-13 11:24:57

基于噪声白化准则的自适应噪声抵消方法

电子发烧友网站提供《基于噪声白化准则的自适应噪声抵消方法.pdf》资料免费下载

2023-10-13 11:23:59

迅为RK3568开发板Scharr滤波器算子边缘检测

：使用 cv2.Scharr 函数，分别对 x 轴和 y 轴进行边缘检测，随后使用 cv2.addWeighted 函数以 0.5：0.5 的比例将两个图像进行融合，最后使用 cv2.imshow()函数对原图

2023-10-09 11:03:15

【KV260视觉入门套件试用体验】Vitis-AI加速的YOLOX视频目标检测示例体验和原理解析

本文将介绍如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测，并对相关源码进行解读。由于演示的示例程序源码是Vitis-AI开源项目提供的，本文演示之前会介绍所需要的准备工作。演示之后

2023-10-06 23:32:47

【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测（OCR&Textmountain）

sample_ocr.jpg OCR 该网络用于光学字符识别，包括文本检测和文本识别。该网络由 ResNet-FPN 特征提取器、检测分支和识别分支构成。此模型由 ICDAR-2017 数据集进行训练。输入为包含

2023-09-26 16:31:59

无线传感器网络数据融合路由算法分析

由于无线传感器网络中节点的能量十分有限，因此在设计各种网络协议时必须考虑节能。采用网内数据处理技术是降低能耗的重要手段，而数据融合与数据路由相结合是实现网内数据处理的重要方法l-3]。数据融合能减少数据

2023-09-21 08:29:44

两关节机械手的自适应控制介绍

就成为当今研究的重点,在此研究自适应控制来解决机器人的控制问题。当操作机器人的工作环境及工作目标的性质和特征在工作过程中随时发生变化时，控制因素具有未知性和不确定的特性。这种未知因素和不确定性将使

2023-09-21 07:55:45

DDFM：首个使用扩散模型进行多模态图像融合的方法

近来去噪扩散概率模型 Denoising diffusion probabilistic model (DDPM)在图像生成中获得很多进步，通过对一张noise-corrupted图像恢复为干净图像的扩散过程进行建模，可以生成质量很好的图像。

2023-09-19 16:02:50

966

CCV 2023 | SparseBEV：高性能、全稀疏的纯视觉3D目标检测器

本文介绍在3D 目标检测领域的新工作：SparseBEV。我们所处的 3D 世界是稀疏的，因此稀疏 3D 目标检测是一个重要的发展方向。然而，现有的稀疏 3D 目标检测模型（如 DETR3D

2023-09-19 10:00:01

412

迅为iTOP-RK3568开发板Sobel 算子边缘检测

对 number.png 图片进行读取；第 3 行使用了 imshow()函数对原图像进行展示；第 4 行使用 Sobel 算子进行边缘检测计算，数据类型设置为 cv2.CV_64F,只算 x 方向梯度

2023-09-18 10:27:56

Versal:首款自适应计算加速平台(ACAP)

电子发烧友网站提供《Versal:首款自适应计算加速平台(ACAP).pdf》资料免费下载

2023-09-18 09:28:17

基于无线射频识别的手术器械自适应分类仿真

无线射频识别技术，可以通过射频识别信号对目标对象进行自动识别，获取数据信息，可在任何环境下进行识别工作，具有一定的应用价值和前景。在医院手术器械中，采用无线识别技术，可以有效的对手术器械进行自适应

2023-09-18 08:53:35

基于BEV的视觉3D目标检测器

根据我们的实验分析，我们认为实现这一目标的关键在于提升检测器在 BEV 空间和 2D 空间的适应性。这种适应性是针对 query 而言的，即对于不同的 query，检测器要能以不同的方式来编码和解码特征。

2023-09-16 10:09:36

409

赛灵思Alveo数据中心智能网卡自适应加速解决方案

电子发烧友网站提供《赛灵思Alveo数据中心智能网卡自适应加速解决方案.pdf》资料免费下载

2023-09-15 15:03:32

机器人中的自适应计算

电子发烧友网站提供《机器人中的自适应计算.pdf》资料免费下载

2023-09-14 09:49:05

可编程单芯片自适应无线电平台

电子发烧友网站提供《可编程单芯片自适应无线电平台.pdf》资料免费下载

2023-09-13 15:44:17

【触觉智能 Purple Pi OH 开发板体验】三、Ubuntu镜像安装OpenCV边缘检测开发

**选择算法和模型**：基于所提取的特征和目标，选择一个合适的算法或模型来检测缺陷。这可能包括统计模型、机器学习模型或者深度学习模型。 5. **训练模型**：使用有标签的数据（即知道哪些是缺陷，哪些不是

2023-09-09 13:20:57

图像处理之目标检测的入门总结

目标检测中有很大一部分工作是做图像分类。对于图像分类，不得不提的是2012年ImageNet大规模视觉识别挑战赛（ILSVRC）上，机器学习泰斗 Geoffrey Hinton 教授带领学生

2023-09-08 17:08:09

455

模拟矩阵在图像识别中的应用

特征提取：通过模拟矩阵处理图像数据，提取关键特征，为后续的图像识别提供依据。图像分类和识别：利用深度学习模型对模拟矩阵中的特征进行分类和识别，对图像进行分类、标注和识别。图像检索：根据模拟矩阵中的数据和模型预

2023-09-04 14:17:20

297

海基红外搜索和跟踪的区域自适应杂波抑制的小红外目标检测系统技术介绍

由于目标信号小而暗淡，远程小目标的检测相当困难。通过降低检测阈值可以实现检测率的标准。另一方面，由于背景混乱，这种简单的方法会导致错误检测的数量增加。图2显示了使用众所周知的修正均值减法滤波器（MMSF）的传统小目标检测方法的问题。

2023-08-30 15:28:13

754

Brocade自适应速率限制白皮书

电子发烧友网站提供《Brocade自适应速率限制白皮书.pdf》资料免费下载

2023-08-29 14:39:42

自适应控制试题

自适应控制理论试题

2023-08-21 12:41:52

变频自适应超声波振动筛电源发生器系统

电源系统模型的"大脑",通过整合和调配超声波换能器模块。变频自适应超声波振动筛电源发生器系统采用频率扫描和振幅检测综合的方法跟踪换能器有效谐振频率;依据串联匹配最佳原理，变频自适应超声波振动筛电源发生器系统能对驱动回路参数

2023-08-11 10:28:42

236

基于LBM的网格自适应划分代码实现

基于LBM的网格自适应划分代码实现

2023-08-10 09:14:48

请问ST25RU3993-HPEV的自适应防碰撞算法是在板子上面实现的吗？

请问ST25RU3993-HPEV的自适应防碰撞算法是在板子上面实现的？还是在STSW-ST25RU001上位机上面实现的？这个算法可否提供？

2023-08-08 08:30:05

基于FPGA的速率自适应图像抽取算法

方法，适用于深空探测航天器载荷自主管理和可视化应用。通过图像帧识别、指针管理和数据筛选实现图像抽帧回放算法，具有图像完整、实时，速率自适应的特点。该方法在某探测器工程项目中采用FPGA进行了实现，经测试、试验验证，

2023-08-05 10:35:02

454

压电陶瓷驱动器单神经元自适应磁滞补偿实验

功率放大器基于Hebb学习规则的压电陶瓷驱动器单神经元自适应磁滞补偿

2023-08-03 14:42:51

AMBA® 自适应流量配置文件

流量配置文件是对接口的事务特性的定义。AMBA自适应交通Profile（ATP）是接口动态特性的规范。AMBA ATP包括交易的类型以及这些交易的时间特征。流量配置文件的主要用途是描述系统中主组

2023-08-02 07:39:38

目标检测的后处理：NMS vs WBF

和图像识别。计算机视觉的主要挑战之一是目标检测，它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能，研究人员和从业者开发了各种技术，例如模型集成和测试

2023-07-31 23:44:18

546

如何利用车载环视相机采集到的图像实现精准的3D目标检测

如何利用车载环视相机采集到的多张图像实现精准的 3D 目标检测，是自动驾驶感知领域的重要课题之一。

2023-07-26 14:11:42

436

目标检测的后处理：NMS vs WBF

自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测，它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能，研究人员和从业者开发了各种技术，例如模型集成和测试时增强（TTA）。模型集成是组合多个模型的预测以提高系统整体性能的过程。这可以通过对

2023-07-26 10:25:02

405

目标检测EDA方法有哪些 eda和pcb的区别

目标检测（Object Detection）是计算机视觉领域中的重要任务，用于在图像或视频中定位和识别出多个感兴趣的对象。EDA（Enhancement， Detection， and Augmentation）方法是一种综合的目标检测方法

2023-07-20 14:43:06

832

基于Yolov5+图像分割的车牌实时检测识别系统

YOLO算法从总体上看，是单阶段端到端的基于anchor-free的检测算法。将图片输入网络进行特征提取与融合后，得到检测目标的预测框位置以及类概率。而YOLOv5相较前几代YOLO算法，模型更小、部署灵活且拥有更好的检测精度和速度，适合实时目标检测。

2023-07-18 14:32:43

1602

基于扩散模型的图像生成过程

等很难用文本指定。最近，谷歌发布了MediaPipe Diffusion插件，可以在移动设备上运行「可控文本到图像生成」的低成本解决方案，支持现有的预训练扩散模型及其低秩自适应（LoRA）变体背景知识基于扩散模型的图像生成过程可以

2023-07-17 11:00:35

1939

关于图像识别的三大要点

图像识别是识别图像或视频中的目标或特征的过程。这项技术已应用于多个领域，如缺陷检测、医学成像和安全监控。

2023-07-13 10:00:51

1022

如何区分图像分类和目标检测技术

目标检测的问题定义是确定目标在给定图像中的位置，如目标定位，以及每个目标属于哪个类别，即目标分类。简单地说，目标检测是一种图像分类技术，除了分类之外，该技术还可以从自然图像中的大量预定义类别中识别出目标实例的位置。

2023-07-11 12:50:07

319

基于Transformer的相机-毫米波雷达融合3D目标检测方法

雷达以用于高级驾驶辅助系统(ADAS)多年。然而，尽管雷达在汽车行业中很流行，考虑到3D目标检测时，大多数工作集中在激光雷达[14,23,25,26,40 - 42,45]、相机[2,7,24,35]，和激光雷达-相机融合[6,11,12,15,16,21 - 23,37,38,43]。

2023-07-10 14:55:09

1244

意大利Dynamic Optics自适应透镜

意大利Dynamic Optics自适应透镜Dynamic Optics以自适应光学技术的领导者为企业发展目标。在成像和激光处理中，要求对光学系统中使用的光学器件进行可调谐调制---- 离

2023-07-10 14:22:48

法国ALPAO 高速自适应光学系统

法国ALPAO 高速自适应光学系统产品介绍：法国ALPAO Shack-Hartmann (SH)波前传感器(WFS)是专为自适应光学(AO)设计的波前传感器系列。它们具有优异的性能，适合各种自适应

2023-06-29 14:19:07

俄罗斯Active Optics NightN Ltd公司自适应光学系统

俄罗斯Active Optics NightN Ltd公司自适应光学系统

2023-06-29 14:05:08

荷兰OKO自适应系统

荷兰OKO自适应系统----波前分析仪和变形镜1997年，荷兰OKO公司成立（Flexible Optical B.V.）。OKO公司是世界上最早进行自适应光学产品研发和销售的公司之一，创始人正是

2023-06-29 13:59:18

基于自适应卡尔曼滤波算法的电池SOC估算研究

本文采用自适应卡尔曼滤波算法，基于Thevenin/RC电池模型，锂离子电池SOC进行估算，并和常规KF算法进行比较分析，以此提高SOC估算的精度。

2023-06-28 11:45:57

1707

基于 FPGA 的目标检测网络加速电路设计

第一部分设计概述 /Design Introduction目前主流的目标检测算法都是用CNN来提取数据特征，而CNN的计算复杂度比传统算法高出很多。同时随着CNN不断提高的精度，其网络深度与参数

2023-06-20 19:45:12

全面介绍小目标检测的各种解决方案

小目标检测广义是指在图像中检测和识别尺寸较小、面积较小的目标物体。通常来说，小目标的定义取决于具体的应用场景，但一般可以认为小目标是指尺寸小于像素的物体，如下图 COCO 数据集的定义。

2023-06-19 12:32:42

2219

无图像单像素目标检测方法可用于自动驾驶汽车

据麦姆斯咨询报道，近期，北京理工大学边丽蘅研究员（通讯作者）、彭林涛（第一作者）等人提出一种无图像单像素目标检测（SPOD）方法

2023-06-19 09:49:28

411

基于计算机视觉领域中的特征检测和匹配研究

我们都知道特征检测和匹配是计算机视觉领域中的重要任务，它们在许多应用中发挥着关键作用，比如SLAM、SFM、AR、VR等许多算法都需要稳定精确的特征检测和匹配。特征检测算法的意义在于从图像

2023-06-16 16:48:28

520

拥塞水平检测和自适应路线规划

电子发烧友网站提供《拥塞水平检测和自适应路线规划.zip》资料免费下载

2023-06-14 11:42:58

采用OFDM信号的MIMO-SAR宽幅成像仿真

SAR以脉冲重复间隔(PRI)为时间间隔依次发送信号，通过收集并处理每个PRI的回波绘制出地面的雷达图像。因此，超宽带(UWB)信号也可作为雷达发射脉冲用于生成目标区域的SAR图像，从而显著提高图像的分辨率。

2023-06-09 10:40:24

518

目标检测多模型集成方法总结

模型集成是一种提升模型能力的常用方法，但通常也会带来推理时间的增加，在物体检测上效果如何，可以看看。

2023-06-07 17:39:42

708

快速入门自动驾驶中目标检测算法

现在目标检测算法总结 1. 目标检测算法在机动车和行人检测识别上应用较多，在非机动车上应用较少 2. 对于目标检测模型增强特征表示和引入上下文信息的改进方法几乎对任何场景和任何任务都是有利

2023-06-06 09:40:12

PyTorch教程-14.7。单发多框检测

在 SageMaker Studio Lab 中打开笔记本在第 14.3 节到第 14.6 节中，我们介绍了边界框、锚框、多尺度目标检测和目标检测数据集。现在我们准备使用这些背景知识来设计一个目标检测模型

2023-06-05 15:44:36

342

AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型

《在AI爱克斯开发板上用OpenVINO加速YOLOv8分类模型》介绍了在AI爱克斯开发板上使用OpenVINO 开发套件部署并测评YOLOv8的分类模型，本文将介绍在AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型。

2023-05-26 11:03:18

660

目标检测的相关知识

目标检测共有以下四个核心问题：（1）目标可能出现在图像的任何位置；（2）目标有各种不同的大小；（3）目标有各种不同的形状；（4）光照、遮挡等因素的干扰。如图2-1所示，在这幅图中，人脸被口罩所遮挡。

2023-05-22 09:43:35

738

DVB-S2标准协议：流自适应与FEC编码简析

流自适应(见图1和图4)提供填充以完成定长(Kbch bit)的BBFRAME和加扰。Kbch取决于FEC码率，如表5所示。

2023-05-22 09:36:08

1384

YOLOv8版本升级支持小目标检测与高分辨率图像输入

YOLOv8版本最近版本又更新了，除了支持姿态评估以外，通过模型结构的修改还支持了小目标检测与高分辨率图像检测。原始的YOLOv8模型结构如下。

2023-05-16 11:14:50

8088

用于二维近场微波和毫米波SAR图像重建的多频CS模型介绍

本文研究了一种新的二维近场微波毫米波合成孔径雷达（SAR）成像系统多频压缩传感（CS）模型，该模型通常收集多频稀疏数据。

2023-05-15 11:09:24

589

异步电机速度估计-模型参考自适应MRAS1

导读：前期文章已经介绍过模型参考自适应MRAS进行速度估计的方法，本期文章主要是对MRAS实现的细节做一下补充。

2023-05-12 10:50:24

392

在AI爱克斯开发板上用OpenVINO™加速YOLOv8目标检测模型

《在 AI 爱克斯开发板上用 OpenVINO 加速 YOLOv8 分类模型》介绍了在 AI 爱克斯开发板上使用 OpenVINO 开发套件部署并测评 YOLOv8 的分类模型，本文将介绍在 AI 爱克斯开发板上使用 OpenVINO 加速 YOLOv8 目标检测模型。

2023-05-12 09:08:12

788

已全部加载完成

搜索历史

双向特征融合的数据自适应SAR图像舰船目标检测模型