现如今,即使可以借助卫星图像和绘制软件,创建精确的道路图也依然是一个费时费力的人力加工过程。许多地区,特别是在发展中国家也仍是空白。为了缩小这一差距,Facebook 的人工智能研究人员和工程师们开发了一种新的方法,该方法通过深度学习和弱监督学习,根据商用高分辨率卫星图像来预测道路网络。由此产生的模型为精确程度设定了一个新标准,因为它能够较好地适应道路网络中的地区差异,有效地预测全球范围内的道路。
我们现在正与 Map With AI(一套新的专用道路图编辑服务和工具)分享我们模型的具体细节,并向全球的绘制机构提供数据。Map With AI 包含一个编辑器界面 —— RapiD,它让道路图专家可以根据自己的需要很方便地查看、校验和调整道路图。
我们使用了 Map With AI 系统在 Facebook 的 OpenStreetMap(OSM)中绘制了泰国所有此前未曾绘制过的道路(超过了 30 万英里),这是一项基于社会机构的工作,旨在创建免费的、可编辑的世界道路图。我们仅仅花了一年半的时间就完成这个项目—— 这比有 100 个绘图专家的团队手工完成这项任务花费的时间减少一半多。
准确的绘制数据有助于我们更好地为世界各地的人们提供 Facebook Marketplace 和 Facebook Local 等技术产品。Map With AI 与 Facebook 人工智能的 population density maps 项目一样,这些道路图将为灾难响应、城市规划、开发项目和许多其他任务提供资源保障。例如,在 2018 年印度喀拉拉邦遭受洪水灾害时,Facebook 利用 Map With AI 快速地绘制出了该地区的道路图,协助了救灾工作。
要使用 RapiD,用户可以在道路图上选择一条道路,在提交给 OSM 系统之前,可以根据实际需要对其进行进一步的编辑。白线表示现有的 OSM 道路,紫红线则表示 RapiD 的预测结果。选用 Maxar 卫星的图像作为背景。
利用新技术实现更高效、更精确的绘图功能
我们已经在几个方面往前推进绘制道路图的研究。在 2018 年的 CVPR 大会上,我们帮助组织了 DeepGlobe 卫星挑战赛(DeepGlobe Satellite Challenge),通过提供数据集和竞赛平台来组织和评估计算机视觉和机器学习的解决方案,推进了卫星图像分析的最高水平。我们还正在开发新的适合遥感问题空间的学习技术和架构,并研究弱监督学习技术,以在全球范围内应用我们的道路绘制工作,还在与绘制团队进行合作,在全球范围内测试这些用于设计比例和构造方面的工具。
道路分割
在从卫星图像中选取道路的过程中,我们利用了最近在使用完全卷积神经网络(Fully Convolutional Neural Networks)进行语义分割,同时结合大规模弱监督学习方面的发展成果。道路检测是语义分割方面的应用,其中道路是前景,图像的其余部分作为背景。如下图所示,过程的输出是一个栅格化的道路图,显示了模型如何预测输入的卫星图像的每个像素是否属于某个道路。对于道路分割,我们使用了 D-LinkNet 架构的修订版本,它在 DeepGlobe 卫星道路获取挑战赛(the DeepGlobe Satellite Road Extraction Challenge)中获胜。向量化和后处理技术可以获取这些输出并转化为与地理空间数据库(如 OSM 系统)兼容的道路向量。
左边是分割模型每个像素的预测结果;紫红色意味着像素有更高的概率属于道路。右边:合并的向量化道路与现有的 OSM 道路(白色),卫星图像由 Maxar 提供
用弱监督学习模式在全球范围绘制道路图
作为上述泰国道路绘制项目的一部分,我们请一些专家检查并修正人工智能系统识别的道路网络。然后,我们使用这些手动更正的道路图作为模型的训练数据。这个项目绘制了整个泰国的公路网络,因此我们对数据的准确性和完整性充满了信心。我们发现,数据集训练在泰国获得了高精度的验证结果,但在其它地区准确性却急剧下降。由于该项目的目标是能够绘制全球的道路图,因此我们研究了如何使用其它地区增加的 OSM 数据来训练一个新的模型。
但是,许多其它国家的道路图仍然存在着巨大差距。因此,我们探索了获取高质量的、地理多样性的训练数据的新方法。我们借鉴了以往关于弱监督图像分类和基于 OSM数据训练建筑检测模型的工作,尝试将这些弱监督学习的思想从分类转换为语义分割。这项实验需要识别具有足够的、准确的数据覆盖率的区域,然后将 OSM 数据库的道路向量转换为栅格化的语义分割标签。对于这两个挑战,我们采取了一种直接的方法,即首先生成带有噪音的、不太完美的训练数据。
我们收集了一组像素为 2048 x 2048 的训练数据,分辨率约为每像素 24 英寸。我们放弃了道路图上少于 25 条路的区域,因为我们发现地图上通常只包括一些主要的道路(通常没有可以正确标注较短道路的先例)。对于剩余的区域,我们将道路向量进行栅格化,并使用结果标识作为训练标签。为了达到与 DeepGlobe 数据集相同的分辨率,我们随机将每个图像的像素剪裁到 1024 x 1024,从而生成了能覆盖到 70 多万平方英里地理范围的大约 180 万个区域,这个结果是 DeepGlobe 数据集覆盖的约 630 平方英里的区域的 1000 倍。
为了从这些道路向量中创建分割标识,我们只需将每个道路向量栅格化为 5 个像素。语义分割标签往往是趋向于像素的,但我们用这种探索式的方法所创建的标签却不是这样的。由于道路的宽度和外形各不相同,这些栅格化了的向量无法完全获取这些信息。此外,全球不同地区的道路是根据不同的卫星图像源绘制的,因此并不总与用于训练数据的图像完全一致 。
用于 OSM 道路分割模型的训练数据的地理分布可视化图。由于实验的时候卫星图像是不可用的,因此一些区域并未在图中出现
仅使用在数据收集过程中产生的噪声标签,我们就能够产生与许多 DeepGlobe 挑战赛参与者不相上下的结果。通过对 DeepGlobe 挑战数据集中训练数据的微调,我们的模型取得了最好的结果。
比这些微调的结果更值得注意的是,即使只在 OSM 数据上进行训练,模型在全球范围内运行的结果也非常不错。大多数可用于训练道路分割模型的数据集严重地偏向于特定的区域或发展水平的地区。例如,DeepGlobe 道路数据集仅包含来自印度、印度尼西亚和泰国的数据,而 SpaceNet 道路获取挑战赛(the SpaceNet Road Extraction Challenge)的数据集仅关注于一些主要的城市。我们创建的数据集跨越了六大洲和各种发展水平的地区,提供的训练数据比其它可用的替代数据要多得多。
为了评估更大的、更多样化的数据集对模型的标准化有多大的影响,我们评估了 OSM 训练模型和 DeepGlobe 模型(在 DeepGlobe 数据上训练)。我们在其它几个数据集(拉斯维加斯、巴黎、上海等城市,请查阅论文获取详情)上对这两个模型进行了评估,这些数据集均不在 DeepGlobe 数据集的地理分布范围内。在这些测试集中,DeepGlobe 模型的平均联合交叉(IoU,the mean Intersection over Union)得分为0.218,而 OSM 训练模型的平均 IoU 得分为 0.355。相比之下,这些分数相对改善 62%,绝对改善 13.7%。
乌干达的坎帕拉,在一个道路图相对绘制较好的地区进行道路获取。从左到右:Maxar 卫星图像、OSM(手动绘制)、THA/IND/IDN 训练模型、全球 OSM 训练模型。在 DeepGlobe 上训练的模型在房屋之间绘制出许多本来不存在的道路,而在全球数据上训练的模型表现不错
能有效创建全新道路图的AI工具
一旦模型识别出潜在的道路,我们就需要对其进行验证并提交给 OSM。将这些数据提供给社区是一个重要环节,我们模型的结果虽然很好,但并不完美。地区的差异会影响道路分类的结果。一些结果错误地跟踪了卫星图像中的其它特征,如干涸的河床、狭窄的海岸线和运河。此外,模型可能无法找到一个区域内的所有道路,或者可能会忽略连接点和潜在的道路, 因此,我们的下一步是将模型的结果与有经验的绘图人员结合。为此,我们利用了道路图绘制社区里已经熟悉的工具(iD, JavaOpenStreetMap, 和 Tasking Manager)。
我们的工作重点是构建 RapiD,它是一个应用广泛的基于 Web 的 iD 道路图编辑器的开源扩展。此外,我们构建了一个系统,将模型的结果与 OSM 中已有的数据结合,这一过程称为合并,它既可以为如何将新道路加入到现有的数据提供建议,又可以防止模型建议的道路覆盖现有道路数据。我们希望 RapiD 能够让道路图绘制社区中的人们根据自己的实际情况来改进并利用这些工具。
RapiD 编辑器允许通过可视化的方式展现合并的道路,并高亮显示新修改的地方,还为最常见的数据清理任务使用新的命令和快捷方式,例如调整道路的分类来适应周围的环境。因为我们扩展了现有的编辑工具 iD,绘图人员能够使用熟悉的工具来处理新的数据。为了确保向 OSM 提交高质量的数据,我们采用了完整性校验来捕获模型结果可能出现的潜在问题。
道路图绘制社区的前期反馈结果令人鼓舞:
“这个工具在建议的机器生成功能和手动绘制方式之间取得了良好的平衡。它能让道路图绘制者对图上的内容有最后决定权,这有助于发现绘制过程中出现的问题。它的优势是绘图人员可以以更具互动性的方式开始绘图。对 iD 的调整和添加的快捷键会使其功能更强大,足以满足绘制人员的需要,”长期致力于 OSM 研究的 Martijn van Exel 说道, “这必然是 OSM 未来的一个关键点。没有机器的帮助,我们无法绘制道路图,更谈不上绘制全世界。诀窍是找到那个点。OSM 是一个全人类的项目,道路图反映了绘制者的兴趣、技能、偏好等。”
“在我看来,RapiD 最独特的优势在于它可用于世界上最复杂的地理环境,这些地区对自动化的需求最为迫切。大多数现代的算法、训练数据集和相关技术都是为那些基础设施高度发达的地区而发明的。在发展中国家,例如非洲、东南亚、拉丁美洲,这些地方的道路没有很好的命名、维护或是开发,即使是最专业的人眼也很难识别和正确地进行道路特征的分类,”一位共享车辆地域经理 Dimitry Kuzhanov 说道。
“RapiD 是向前迈出的重要一步,因为它将人工智能的能力与人类天生具有的智慧和对关联性的理解力结合了起来。”Mapillary 的战略合作伙伴经理 Edoardo Neerhut 这样说道。
总之,好的工具可以增强道路图绘制人员的能力,减少基于卫星数据绘制道路的繁琐和耗时的工作,提高道路形状的准确性,并为识别建议道路提供选项,即使绘制者选择不使用这些建议。能提供不受专业绘制者能力和判断限制的工具很重要。我们将根据这些绘制者的反馈不断改进 RapiD,让它的使用过程更加顺畅。我们相信,由此产生的生产能力提高了卫星图像在道路图绘制方面的效率。
-
卫星
+关注
关注
18文章
1747浏览量
67995 -
人工智能
+关注
关注
1804文章
48539浏览量
245545
原文标题:超酷炫!Facebook用深度学习和弱监督学习绘制全球精准道路图
文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
基于卫星图像的智能定位系统软件
基于卫星图像的智能定位系统全面解析
OptiSystem应用:真实图像在光纤中传输后的恢复
LITESTAR 4D在道路照明中的应用
源钳位反激控制器(UCC28780)其在提高功率密度方面的优势

如何提高poe供电效率
《DNK210使用指南 -CanMV版 V1.0》第三十三章 image元素绘制实验
图像采集卡不断发展和改进,为视觉系统提供更大的价值

国产光耦合器在提高各行业能源效率方面的作用
人工智能在军事方面的应用
大数据在军事方面的应用有哪些

TwinCAT3 EtherCAT抓包 | 技术集结
在使用TwinCAT测试EtherCATEOE功能时,我们会发现正常是无法使用Wireshark去进行网络抓包抓取EtherCAT报文的,今天这篇文章就带大家来上手EtherCAT抓包方式。准备环境硬件环境:EtherKit开发板网线一根Type-CUSB线一根软件环境TwinCAT3RT-ThreadstudiowiresharkEtherCATEOE工程

EtherCAT科普系列(8):EtherCAT技术在机器视觉领域的应用
机器视觉是基于软件与硬件的组合,通过光学装置和非接触式的传感器自动地接受一个真实物体的图像,并利用软件算法处理图像以获得所需信息或用于控制机器人运动的装置。机器视觉可以赋予机器人及自动化设备获取外界信息并认知处理的能力。机器视觉系统内包含光学成像系统,可以作为自动化设备的视觉器官实现信息的输入,并借助视觉控制器代替人脑实现信息的处理与输出。从而实现赋予自动化

新品 | 26+6TOPS强悍算力!飞凌嵌入式FCU3501嵌入式控制单元发布
飞凌嵌入式FCU3501嵌入式控制单元基于瑞芯微RK3588处理器开发设计,4xCortex-A76+4xCortex-A55架构,A76主频高达2.4GHz,A55核主频高达1.8GHz,支持8K编解码,NPU算力6TOPS,支持算力卡拓展,可以插装Hailo-8 26TOPS M.2算力卡。

接口核心板必选 | 视美泰AIoT-3568SC 、 AIoT-3576SC:小身材大能量,轻松应对多场景设备扩展需求!
在智能硬件领域,「适配」是绕不开的关键词。无论是小屏设备的”寸土寸金”,还是模具开发的巨额成本,亦或是多产品线兼容的复杂需求,开发者总在寻找一款能「以不变应万变」的核心解决方案。视美泰旗下的AIoT-3568SC与AIoT-3576SC接口核心板系列,可以说是专为高灵活适配场景而生!无需为设备尺寸、模具限制或产品线差异妥协,一块核心板,即可释放无限可能。为什

3核A7+单核M0多核异构,米尔全新低功耗RK3506核心板发布
近日,米尔电子发布MYC-YR3506核心板和开发板,基于国产新一代入门级工业处理器瑞芯微RK3506,这款芯片采用三核Cortex-A7+单核Cortex-M0多核异构设计,不仅拥有丰富的工业接口、低功耗设计,还具备低延时和高实时性的特点。核心板提供RK3506B/RK3506J、商业级/工业级、512MB/256MBLPDDR3L、8GBeMMC/256

搭建树莓派网络监控系统:顶级工具与技术终极指南!
树莓派网络监控系统是一种经济高效且功能多样的解决方案,可用于监控网络性能、流量及整体运行状况。借助树莓派,我们可以搭建一个网络监控系统,实时洞察网络活动,从而帮助识别问题、优化性能并确保网络安全。安装树莓派网络监控系统有诸多益处。树莓派具备以太网接口,还内置了Wi-Fi功能,拥有足够的计算能力和内存,能够在Linux或Windows系统上运行。因此,那些为L

STM32驱动SD NAND(贴片式SD卡)全测试:GSR手环生物数据存储的擦写寿命与速度实测
在智能皮电手环及数据存储技术不断迭代的当下,主控 MCU STM32H750 与存储 SD NAND MKDV4GIL-AST 的强强联合,正引领行业进入全新发展阶段。二者凭借低功耗、高速读写与卓越稳定性的深度融合,以及高容量低成本的突出优势,成为大规模生产场景下极具竞争力的数据存储解决方案。

芯对话 | CBM16AD125Q这款ADC如何让我的性能翻倍?
综述在当今数字化时代,模数转换器(ADC)作为连接模拟世界与数字系统的关键桥梁,其技术发展对众多行业有着深远影响。从通信领域追求更高的数据传输速率与质量,到医疗影像领域渴望更精准的疾病诊断,再到工业控制领域需要适应复杂恶劣环境的稳定信号处理,ADC的性能提升成为推动这些行业进步的重要因素。行业现状分析在通信行业,5G乃至未来6G的发展,对基站信号处理提出了极

史上最全面解析:开关电源各功能电路
01开关电源的电路组成开关电源的主要电路是由输入电磁干扰滤波器(EMI)、整流滤波电路、功率变换电路、PWM控制器电路、输出整流滤波电路组成。辅助电路有输入过欠压保护电路、输出过欠压保护电路、输出过流保护电路、输出短路保护电路等。开关电源的电路组成方框图如下:02输入电路的原理及常见电路1AC输入整流滤波电路原理①防雷电路:当有雷击,产生高压经电网导入电源时

有几种电平转换电路,适用于不同的场景
一.起因一般在消费电路的元器件之间,不同的器件IO的电压是不同的,常规的有5V,3.3V,1.8V等。当器件的IO电压一样的时候,比如都是5V,都是3.3V,那么其之间可以直接通讯,比如拉中断,I2Cdata/clk脚双方直接通讯等。当器件的IO电压不一样的时候,就需要进行电平转换,不然无法实现高低电平的变化。二.电平转换电路常见的有几种电平转换电路,适用于

瑞萨RA8系列教程 | 基于 RASC 生成 Keil 工程
对于不习惯用 e2 studio 进行开发的同学,可以借助 RASC 生成 Keil 工程,然后在 Keil 环境下愉快的完成开发任务。

共赴之约 | 第二十七届中国北京国际科技产业博览会圆满落幕
作为第二十七届北京科博会的参展方,芯佰微有幸与800余家全球科技同仁共赴「科技引领创享未来」之约!文章来源:北京贸促5月11日下午,第二十七届中国北京国际科技产业博览会圆满落幕。本届北京科博会主题为“科技引领创享未来”,由北京市人民政府主办,北京市贸促会,北京市科委、中关村管委会,北京市经济和信息化局,北京市知识产权局和北辰集团共同承办。5万平方米的展览云集

道生物联与巍泰技术联合发布 RTK 无线定位系统:TurMass™ 技术与厘米级高精度定位的深度融合
道生物联与巍泰技术联合推出全新一代 RTK 无线定位系统——WTS-100(V3.0 RTK)。该系统以巍泰技术自主研发的 RTK(实时动态载波相位差分)高精度定位技术为核心,深度融合道生物联国产新兴窄带高并发 TurMass™ 无线通信技术,为室外大规模定位场景提供厘米级高精度、广覆盖、高并发、低功耗、低成本的一站式解决方案,助力行业智能化升级。

智能家居中的清凉“智”选,310V无刷吊扇驱动方案--其利天下
炎炎夏日,如何营造出清凉、舒适且节能的室内环境成为了大众关注的焦点。吊扇作为一种经典的家用电器,以其大风量、长寿命、低能耗等优势,依然是众多家庭的首选。而随着智能控制技术与无刷电机技术的不断进步,吊扇正朝着智能化、高效化、低噪化的方向发展。那么接下来小编将结合目前市面上的指标,详细为大家讲解其利天下有限公司推出的无刷吊扇驱动方案。▲其利天下无刷吊扇驱动方案一

电源入口处防反接电路-汽车电子硬件电路设计
一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极
评论