0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Transformer的越野场景可通行区域检测模型OFF-Net

3D视觉工坊 来源:泡泡机器人 作者:泡泡机器人 2022-10-31 17:25 次阅读

可通行区域检测对于自动驾驶车辆的环境感知和路径规划至关重要。过去十年基于学习的可通行区域检测算法取得了很大的成功,但是基本上都是关注城市场景的可通行区域检测。相比于规则的城市场景道路,越野场景道路复杂多变,可通行区域检测更加困难,另外目前缺少开源的越野场景可通行检测数据集和算法基准。因此,本文开源第一个覆盖多种越野场景的可通行区域检测数据集,ORFD。ORFD采集了包括草原、林地、农田和乡村道路等不同场景道路,覆盖晴天、雨天、雾天和雪天等不同无人车行驶天气状况,包含强光、日光、微光和黑暗等光照条件。ORFD一共有12198帧激光雷达点云和图像对数据,在图像视角进行了标注,包含三种类别:可通行区域、不可通行区域和不可到达区域(如天空)。我们同时还提出了一个基于Transformer的越野场景可通行区域检测模型OFF-Net,利用交叉注意力机制自适应融合点云和图像的多模态信息。数据集和基准代码下载链接:https://github.com/chaytonmin/Off-Road-Freespace-Detection。

主要工作与贡献

我们开源了第一个越野场景可通行区域检测数据集ORFD,包括草原、林地、农田和乡村道路等不同场景道路,覆盖晴天、雨天、雾天和雪天等不同无人车行驶天气状况,包含强光、日光、微光和黑暗等光照条件。

我们提出了一个越野场景可通行区域检测基准算法OFF-Net,采用Transformer结构聚合全局信息,设计cross-attention自适应挖掘点云和图像的多模态信息。

我们的越野场景可通行区域检测数据集ORFD和算法基准OFF-Net,有助于提高无人车在越野场景的自主行使能力。

算法流程

城市场景道路和越野场景道路对比

图1 (a) 城市场景道路有清晰的道路边界 (b)越野场景可通行区域难以准确定义。

数据采集装置

图2 越野场景可通行区域检测数据集ORFD采集装置:Pandora 40线的激光雷达,相机和激光雷达一体。联合标注激光雷达和相机。

越野场景可通行区域检测数据集ORFD

图3 越野场景可通行区域检测数据集ORFD,包括草原、林地、农田和乡村道路等不同场景道路,覆盖晴天、雨天、雾天和雪天等不同无人车行驶天气状况,包含强光、日光、微光和黑暗等光照条件。采集了30段道路数据,一共有12198帧激光雷达点云和图像对数据。在图像视角进行了标注,包含三种类别:可通行区域、不可通行区域和不可到达区域(如天空)。

数据集划分

越野场景可通行区域检测基准算法OFF-Net

图4 提出的越野场景可通行区域检测基准算法OFF-Net。首先将激光雷达点云投到相机视角得到深度图,然后计算得到法向量图,再利用Transformer网络融合法向量图和图像,得到道路分割结果。

实验结果

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1200

    浏览量

    24617
  • 自动驾驶
    +关注

    关注

    782

    文章

    13616

    浏览量

    165902

原文标题:ORFD: 第一个开源的越野环境可通行区域检测数据集和基准

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Transformer能代替图神经网络吗

    Transformer作为一种在处理序列数据方面表现出色的深度学习模型,自其提出以来,已经在自然语言处理(NLP)、时间序列分析等领域取得了显著的成果。然而,关于Transformer是否能完全代替图神经网络(GNN)的问题,需
    的头像 发表于 07-12 14:07 348次阅读

    Transformer语言模型简介与实现过程

    在自然语言处理(NLP)领域,Transformer模型以其卓越的性能和广泛的应用前景,成为了近年来最引人注目的技术之一。Transformer模型由谷歌在2017年提出,并首次应用于
    的头像 发表于 07-10 11:48 1093次阅读

    人脸检测模型的精确度怎么算

    检测是计算机视觉领域的一个重要研究方向,其目的是在图像或视频中快速准确地定位人脸的位置。人脸检测模型通常包括两个主要步骤:人脸候选区域的生成和人脸的分类。人脸候选
    的头像 发表于 07-04 09:14 408次阅读

    Transformer模型在语音识别和语音生成中的应用优势

    随着人工智能技术的飞速发展,语音识别和语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型,自其诞生以来,凭借其独特的自注意力机制和并行计算能力,在
    的头像 发表于 07-03 18:24 918次阅读

    使用PyTorch搭建Transformer模型

    Transformer模型自其问世以来,在自然语言处理(NLP)领域取得了巨大的成功,并成为了许多先进模型(如BERT、GPT等)的基础。本文将深入解读如何使用PyTorch框架搭建Trans
    的头像 发表于 07-02 11:41 1394次阅读

    【大语言模型:原理与工程实践】大语言模型的基础技术

    全面剖析大语言模型的核心技术与基础知识。首先,概述自然语言的基本表示,这是理解大语言模型技术的前提。接着,详细介绍自然语言处理预训练的经典结构Transformer,以及其工作原理,为构建大语言
    发表于 05-05 12:17

    【大语言模型:原理与工程实践】探索《大语言模型原理与工程实践》

    《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言模型的基本概念、基础技术、应用场景分析,为读者揭开了这一领域的神秘面纱。本书不仅深入讨论了语言
    发表于 04-30 15:35

    基于Transformer模型的压缩方法

    基于Transformer架构的大型模型在人工智能领域中发挥着日益重要的作用,特别是在自然语言处理(NLP)和计算机视觉(CV)领域。
    的头像 发表于 02-22 16:27 583次阅读
    基于<b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>的压缩方法

    一文详解Transformer神经网络模型

    Transformer模型在强化学习领域的应用主要是应用于策略学习和值函数近似。强化学习是指让机器在与环境互动的过程中,通过试错来学习最优的行为策略。
    发表于 02-20 09:55 1.2w次阅读
    一文详解<b class='flag-5'>Transformer</b>神经网络<b class='flag-5'>模型</b>

    基于DiAD扩散模型的多类异常检测工作

    现有的基于计算机视觉的工业异常检测技术包括基于特征的、基于重构的和基于合成的技术。最近,扩散模型因其强大的生成能力而闻名,因此本文作者希望通过扩散模型将异常区域重构成正常。
    的头像 发表于 01-08 14:55 1175次阅读
    基于DiAD扩散<b class='flag-5'>模型</b>的多类异常<b class='flag-5'>检测</b>工作

    大语言模型背后的Transformer,与CNN和RNN有何不同

      电子发烧友网报道(文/李弯弯)近年来,随着大语言模型的不断出圈,Transformer这一概念也走进了大众视野。Transformer是一种非常流行的深度学习模型,最早于2017年
    的头像 发表于 12-25 08:36 3632次阅读
    大语言<b class='flag-5'>模型</b>背后的<b class='flag-5'>Transformer</b>,与CNN和RNN有何不同

    基于transformer和自监督学习的路面异常检测方法分享

    铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和自监督学习的新方法,有助于定位异常区域
    的头像 发表于 12-06 14:57 1372次阅读
    基于<b class='flag-5'>transformer</b>和自监督学习的路面异常<b class='flag-5'>检测</b>方法分享

    AI Transformer模型支持机器视觉对象检测方案

    使用机器视觉进行对象检测需要 AI 模型/算法在 AI 芯片、FPGA 或模块上运行。它们通常被称为“人工智能引擎”。在首次训练后,可以部署 AI 模型以在适当的硬件上运行,以做出预测和/或决策,通常称为“推理”。确保硬件开发能
    发表于 11-23 10:31 455次阅读
    AI <b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>支持机器视觉对象<b class='flag-5'>检测</b>方案

    关于深度学习模型Transformer模型的具体实现方案

    Transformer 本质上是一个 Encoder-Decoder 架构。因此中间部分的 Transformer 可以分为两个部分:编码组件和解码组件。
    发表于 11-17 10:34 486次阅读
    关于深度学习<b class='flag-5'>模型</b><b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>的具体实现方案

    ADAS系统中的可行使区域Freespace到底如何检测

    自动驾驶有可能大大减少交通事故、道路拥堵以及相关的经济损失。安全的自动驾驶需要检测周围的障碍物、移动物体并识别驾驶区域
    的头像 发表于 11-15 15:53 467次阅读
    ADAS系统中的可行使<b class='flag-5'>区域</b>Freespace到底如何<b class='flag-5'>检测</b>?