卫星图像进行目标识别仍然困难重重,美国提出了一种方法-电子发烧友网

编者按：CV中的目标物体识别进步非常快，但是想对卫星图像进行目标识别仍然困难重重。美国研究者就提出了一种方法——You Only Look Twice，能清晰地看到卫星图像中的汽车、飞机场上的飞机及建筑物，并开放了代码（见文末）。以下是论智带来的编译。

在大范围图像中对小目标进行检测是卫星图像分析的主要问题。虽然深度学习方法为基于地面的目标检测提供了许多方法，将这种技术转化为图片是非常重要的步骤。其中最大的挑战就是所有像素的数量和每张图片的地理内容：一张DigitalGlobe（美国的一家商业空间图像和地理空间内容提供商，并操控数台遥感航天器）卫星图片涵盖了64m2以上的土地，有超过2.5亿个像素。另一个挑战是，我们想要观察的对象物体非常小（经常在10像素左右），这对传统的计算机视觉技术来说是一项很复杂的任务。为了解决这个问题，我们提出了一个流程，即“You Only Look Twice”（只需看两眼），它能以每秒大于0.5平方米的速度对卫星图像进行评估扫描，可以快速地在不同范围内对目标物体进行检测，同时只需较少的训练数据。我们在图片的原始分辨率下对图片进行评估，同时生成的车辆定位F1分数大于0.8。之后我们又系统地测试了降低分辨率和目标物体尺寸后的效果，最后得出当尺寸降至5像素时，系统的识别率仍然很高。

遇到的挑战

深度学习方法在传统目标检测上的应用是非常重要的。而卫星图像的特殊性使能够解决空间前景内容、能进行旋转变换以及大范围搜索的算法成为必要的。除了安装细节，算法还必须满足以下四个条件：

小空间范围（small spatial extent）：与ImageNet数据集中的清晰大图不同，卫星图像中的目标物体通常很小，并且分布较密集。在卫星成像领域，分辨率通常被定义为“地面采样距离（GSD）”，它描述了一个像素的实际距离。商业用途的图像尺寸在DigitalGlobe的30厘米GSD到卫星成像的3—4米GSD左右。这意味着，即使在最高的分辨率下，汽车之类的小目标也只有15像素左右大小。

完全的旋转不变性（rotation invariance）：从空中看到的物体可能会有各种朝向。比如，船行进的方向可能有许多中，但是像ImageNet中的大树却总是垂直的。

训练样本频率（training example frequency）：训练数据相对不足。

极高分辨率（ultra high resolution）：输入的图像非常大，常常有百万像素。所以简单地对输入图像尺寸进行下采样不合适。

DigitalGlobe在巴拿马运河附近拍摄的8×8km（约16000×16000像素）的图像，GSD为50cm。红框表示416×416像素大小的区域

You Only Look Twice

为了解决模型无法检测像素过小的目标、难以生成全新比例的图像等限制，我们提出了一种经过优化的为卫星图像目标检测框架：You Only Look Twice（YOLT）。我们扩展了Darknet神经网络框架，同时更新了一些C函数库一共地理空间图像分析，并且整合了外部Python库。我们选择Python用户社群来进行预处理和后处理。在更新完C代码和进行预处理和后处理之间，参与者无需对C有深入了解。

网络结构

为了减少模型的粗糙度同时增强检测密集物体时的精确度，我们所使用的是一个具有22层的网络，并且以16为系数进行降采样。所以输入一张416×416像素的图片会生成一个26×26的网格。该网络受30层的YOLO启发，经过优化后专为检测小型密集对象。密集网格对散布型场景（如机场）可能不太重要，但是对高密度场景（如停车场）非常重要。

空中成像的目标物体检测对标准网络架构的挑战。两张图片来自统一数据集。左图中的模型将4000×4000像素的测试图像降采样到416×416，图中共有1142辆车，没有一辆被识别出来。右图中的模型同样是416×416，漏报率过多是由于车辆密度太大，13×13的网格无法将它们分辨出来

为了提高模型识别小物体的准确度，我们还加入了一个穿透层，与最后的52×52图层连接起来成为最后的卷积层，可以让探测器获得扩展后的特征向量更细微的特征。

测试过程

在测试时，我们将不同尺寸的测试图片分割成可操作的小图，并将每个小图在训练过的模型上进行实验。如下图所示：

测试过程是从左图移动到右图，重叠部分在右下图中用红色表示。重叠部分的非极大抑制对于改善小图边缘的目标检测是非常有必要的

许多卫星成像的性能都依赖于其内部拍摄全局大图的能力。所以，小型图像芯片远不如由卫星平台自己拍摄的大型图像。物体检测的最后一步就是将成百上千张测试芯片连接到最后的图像层中。

目标检测结果

最初，我们想只训练一个分类器，让其能够辨认交通工具、基础设施等许多种类的物体。但是结果并不理想，在对机场的识别中，我们发现这样的结果：

这一通用模型产生了较差的结果。检测到的飞机被红框圈起来，可以看到还有几架被遗漏。另外蓝框内是被模型误解的“跑道”

要解决这一问题，我们试着利用卫星成像中的规模信息，运行两个不同的分类器：一个用于识别交通工具和建筑，另一个用来检查机场。第一种分类器的尺寸为200m，第二种为2500m。我们将测试照片分成合适尺寸的小图，然后将每张小图输入到分类器中。最终将多个分类器的结果结合成最后一张图像，我们发现检测率在0.3和0.4之间的生成的F1分数最高。以下是目标检测器在各个类别下的表现：

可以看到，YOLT在机场、飞机和船几个类别中表现得很好

细节表现分析

接着，我们在COWC数据集上测试了YOLT对汽车的检测结果，下图是在每个场景中模型的F1分数以及对汽车数量计算的精确度：

上面的图示COWC中每个测试场景的F1分数，下面的图是将检测次数作为标准数值的一部分

不同分辨率下的目标检测。左图的GSD为15cm，F1分数为0.94。右图的GSD为90cm，F1分数为0.84

结语

目标检测算法在定位类似ImageNet数据集中的图片上取得了巨大进步，但是这类算法通常不适合用于卫星图片中的目标检测。为了解决这一限制，我们提出了一种完全卷积的神经网络模型（YOLT），它能快速定位卫星图片中的汽车、建筑和机场。最终的F1分数从0.6到0.9不等，取决于不同的检测种类。代码目前已在GitHub上开放.

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4785

浏览量
101301
数据集

数据集

+关注

关注
4

文章
1212

浏览量
24892
深度学习

深度学习

+关注

关注
73

文章
5522

浏览量
121685

原文标题：“只需看两次”——对卫星图像进行快速目标识别的新方法

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

一种基于图像平移的目标检测框架

1、摘要近年来，在深度卷积神经网络(CNNs)的帮助下，图像和视频监控在智能交通系统(ITS)中取得了长足的进展。作为一种先进的感知方法，智能交通系统对视频监控中每一帧感兴趣的

发表于 08-31 07:43

一种适用于空间观测任务的实时多目标识别算法分享

基于嵌入式图像处理平台的实时多目标识别算法人工智能技术与咨询昨天本文来自《科学技术与工程》，作者王旭辉等摘要提出了一种适用于空间观测任务的实时多

发表于 12-21 07:02

基于NMI特征的目标识别与跟踪

本文提出一种全新的图像分割方法——连通线多级切割方法，并在此基础上建立图像NMI特征的

发表于 07-15 10:36 •20次下载

基于USB和目标识别的图像采集系统的设计实现

介绍了一种有目标识别功能的图像采集系统，用USB 接口芯片实现了数据的传输。阐述了系统的硬件、固件、设备驱动程序和应用软件的设计与实现方法。详细介绍了

发表于 08-13 08:42 •14次下载

基于小波域NMF特征提取的SAR图像目标识别方法

该文提出了一种基于小波域非负矩阵分解特征提取的合成孔径雷达图像目标识别方法。该方法对图像二维离散

发表于 11-21 11:58 •21次下载

一种基于轮廓分析的图像特征点检测方法

图像特征点检测是图像匹配、目标识别以及运动估计等领域的一项关键技术。本文对图像轮廓二维信息进行降

发表于 12-14 13:30 •15次下载

运动目标识别与跟踪系统的研究

提出了一种运动目标识别与跟踪系统的方案，给出了系统的原理图和结构框图。重点论述了图像处理的过程和算法，包括颜色模型的选择，

发表于 07-20 16:14 •29次下载

军事假目标识别的新方法

通常的侦察手段对于军事假目标的识别能力有限，文中提出了一种新的军事假目标识别方法。在介绍偏振成像机理的基础上，分析了偏振信息检测和强度信息检

发表于 08-29 15:11 •36次下载

基于相关分析的飞机目标识别方法

提出了一种基于相关分析的飞机目标识别方法。该方法利用飞机图像低频和高频部分合成滤波器模板，能达到很高识别

发表于 09-02 14:54 •21次下载

基于SIFT视觉词汇的目标识别算法

针对被局部遮挡目标的识别困难的问题，将目标图像的SIFT（ Scale Invariant Feature Transform）特征矢量作为视觉单词，应用视觉词汇算法，

发表于 11-14 11:04 •5次下载

基于扩展字典稀疏表示分类的遥感目标识别

针对遥感图像视觉对比度差、分辨率低及目标含有不同角度旋转的情况，在稀疏表示分类识别的基础上，提出一种基于扩展字典稀疏表示的遥感

发表于 11-17 17:18 •9次下载

一种图像拼接的运动目标检测方法

图像拼接中出现的运动目标可能使拼接出现不能正常拼接或者拼接出多重影像的现象。本文提出一种图像拼接的运动目

发表于 12-08 10:05 •2次下载

基于8片TMS320C6416的卫星图像目标提取高速处理系统

电子发烧友网站提供《基于8片TMS320C6416的卫星图像目标提取高速处理系统.pdf》资料免费下载

发表于 10-19 14:35 •1次下载

机器视觉的图像目标识别方法操作要点

通过加强图像分割，能够提高机器视觉的图像目标识别的自动化水平，使得图像目标识别效果更加显著。图像

发表于 01-15 12:17 •505次阅读

机器视觉的图像目标识别方法综述

文章来源：MEMS引言从20世纪80年代开始，机器视觉技术的发展速度不断加快，已经走进了人们的日常生活与工作之中。机器视觉的图像目标识别系统的自动化程度较高，应用范围广，尤其在危险场所的运用，采用

发表于 02-23 08:26 •802次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

卫星图像进行目标识别仍然困难重重,美国提出了一种方法

评论

一种基于图像平移的目标检测框架

一种适用于空间观测任务的实时多目标识别算法分享

基于NMI特征的目标识别与跟踪

基于USB和目标识别的图像采集系统的设计实现

基于小波域NMF特征提取的SAR图像目标识别方法

一种基于轮廓分析的图像特征点检测方法

运动目标识别与跟踪系统的研究

军事假目标识别的新方法

基于相关分析的飞机目标识别方法

基于SIFT视觉词汇的目标识别算法

基于扩展字典稀疏表示分类的遥感目标识别

一种图像拼接的运动目标检测方法

基于8片TMS320C6416的卫星图像目标提取高速处理系统

机器视觉的图像目标识别方法操作要点

机器视觉的图像目标识别方法综述