0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息获CVPR2024自动驾驶挑战赛"Occupancy& Flow"冠军

全球TMT 来源:全球TMT 作者:全球TMT 2024-06-25 20:29 次阅读

北京2024年6月25日 /美通社/ -- 近日,在全球权威的CVPR 2024自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的"F-OCC"算法模型以48.9%的出色成绩斩获占据栅格和运动估计(Occupancy & Flow)赛道第一名。继22、23年在纯视觉和多模态等自动驾驶感知方向,多次登顶nuSences 3D目标检测榜单后,该AI团队面向Occupancy技术再一次实现突破,实现了对高度动态及不规则的驾驶场景更精准的3D感知及运动预测。

wKgZomZ6uBiAEXvPAACAQ3r7J5A389.jpg

图1-浪潮信息AI团队斩获占据栅格和运动估计赛道第一名

CVPR 2024自动驾驶国际挑战赛是国际计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)的一个重要组成部分,专注于自动驾驶领域的技术创新和应用研究。2024年CVPR自动驾驶国际挑战赛,包含感知、预测、规划三大方向七个赛道,旨在深入探索自动驾驶领域的前沿课题。

三维感知和预测是自动驾驶领域的新兴任务,要求对车辆行驶场景进行细粒度建模,对于提升自动驾驶的环境感知能力有着重要意义。此次浪潮信息AI团队所登顶的占据栅格和运动估计(Occupancy & Flow)赛道,是CVPR 2024自动驾驶国际挑战赛最受关注的赛道,聚焦感知任务,吸引了全球17个国家和地区,90余支顶尖AI团队参与挑战。比赛提供了基于 nuScenes 数据集的大规模占用栅格数据与评测标准,要求参赛队伍利用相机图像信息对栅格化三维空间的占据情况(Occupancy)和运动(Flow)进行预测,以此来评估感知系统对高度动态及不规则驾驶场景的表示能力。

占据栅格 Occupancy:挑战更精细的环境感知与预测

道路布局的复杂性、交通工具的多样性以及行人流量的密集性,是当前城市道路交通的现状,也是自动驾驶领域面临的现实挑战。为了应对这一挑战,有效的障碍物识别和避障策略,以及对三维环境的感知和理解就变得至关重要。传统的三维物体检测方法通常使用边界框来表示物体的位置和大小,但对于几何形状复杂的物体,这种方法往往无法准确描述其形状特征,同时也会忽略对背景元素的感知。因此,基于三维边界框的传统感知方法已经无法满足复杂道路环境下的精准感知和预测需求。

wKgaomZ6uBmAT7bVAAB4VWLu5iI565.jpg

图2 - 针对挖车中的力臂,3D目标检测算法只能给出挖车整体的轮廓框(左),但占据栅格网络却可以更精准地描述挖车具体的几何形状这类细节信息(右)

Occupancy Networks(占据栅格网络) 作为一种全新的自动驾驶感知算法,通过获取立体的栅格占据信息,使系统能够在三维空间中确定物体的位置和形状,进而有效识别和处理那些未被明确标注或形状复杂的障碍物,如异形车、路上的石头、散落的纸箱等。这种占据栅格网络使得自动驾驶系统能够更准确地理解周围的环境,不仅能识别物体,还能区分静态和动态物体。并以较高的分辨率和精度表示三维环境,对提升自动驾驶系统在复杂场景下的安全性、精度和可靠性至关重要。

全面提升!48.9%的绝佳性能表现,创本赛道最高成绩

在占据栅格和运动估计(Occupancy & Flow)赛道中,该AI团队所提交的"F-OCC"算法模型,凭借先进的模型结构设计、数据处理能力和算子优化能力,实现了该赛道最强模型性能,在RayIoU(基于投射光线的方式评估栅格的占用情况)及mAVE(平均速度误差)两个评测指标中均获得最高成绩。

■ 更简洁高效的模型架构,实现运算效率与检测性能双突破

首先,模型整体选择基于前向投影的感知架构,并采用高效且性能良好的FlashInternImage模型。同时,通过对整体流程进行超参调优、算子加速等优化,在占据栅格(Occupancy)和运动估计(Flow)均获得最高分的同时,提升了模型的运算效率,加快了模型迭代与推理速度。在实际应用场景中,这种改进使得模型能够更快速、高效地处理大规模3D体素数据,使得自动驾驶车辆能更好地理解环境,进而提升决策的准确度和实时性。

wKgZomZ6uBqAIiFgAACDhktWtS8619.jpg

图3 - F-OCC算法模型架构图

■ 更强大完善的数据处理,全面提升模型检测能力

在数据处理方面,比赛提供的体素(Voxel)标签包含了大量在图像中无法观测到的点,例如被物体遮挡的体素和物体内部不可见的体素,这些标签在训练过程中会对基于图像数据的预测网络训练产生干扰。在训练数据中,该AI团队通过模拟LiDAR光束的方法,生成可视化掩码,提升了模型的预测精度;另一方面,通过引入感知范围边缘的体素点参与训练,有效解决出现在感知边缘区域的误检问题,将模型的整体检测性能提升11%。

■ 更精细的3D体素编码,模型占据预测能力提升超5%

在3D体素特征编码模块中,该算法团队将具有较大感知范围和编码能力的可形变卷积操作应用于3D体素数据,以提升3D特征的表示能力。通过使用CUDA对可形变3D卷积(DCN3D)进行实现与优化,大幅提升了模型的运算速度,并有效降低了显存消耗。通过DCN3D替代传统3D卷积,模型整体占据预测能力提升超5%。

基于OCC 3D空间感知算法的创新, "F-OCC"算法模型成功登顶占据栅格和运动估计任务(Occupancy & Flow)榜单,以48.9%的出色成绩创造了本赛道的最高成绩,为探索更高级别的自动驾驶技术提供了有力的支撑与经验。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。

* 备注:文内所涉术语解释如下

Occupancy:在自动驾驶领域,通常称为“占据栅格”或“占用栅格”,其是一种3D语义占用感知方法,通过生成车辆周围环境的三维占用网格,为自动驾驶车辆提供障碍物检测、路径规划和车辆控制等关键功能;

RayIoU:是指通过光线投射的方式评估占据网格的占用情况(Ray-based Intersection over Union),RayIoU可以用来衡量预测的占据网格与实际占据网格之间的重叠程度。RayIoU越高意味着预测准确度越高,模型性能越好;

mAVE: 是指平均速度误差(Mean Absolute Velocity Error),其用于评估预测速度与真实速度之间的平均误差。mAVE值越低意味着预测结果与真值越接近;

体素(Voxel):体积元素(Volume Pixel)的简称体积元素(Volume Pixel)的简称,其类似于二维图像中的像素,是构成三维图像的基本单元。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    427

    浏览量

    23660
  • AI
    AI
    +关注

    关注

    87

    文章

    27605

    浏览量

    265208
  • 自动驾驶
    +关注

    关注

    777

    文章

    13254

    浏览量

    164181
收藏 人收藏

    评论

    相关推荐

    CET中电技术邀您参加2024年度陕西省电气与智能化学术&信息交流年会

    6月21日,2024年度陕西省电气与智能化学术&信息交流年会将在西安市汇成天玺酒店举行。年会主题为“融合创新智慧未来”,将以建设安全、舒适、绿色、健康和可持续发展的智能建筑与智慧城市为出发点
    的头像 发表于 06-18 08:36 157次阅读
    CET中电技术邀您参加<b class='flag-5'>2024</b>年度陕西省电气与智能化学术&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>信息</b>交流年会

    解读北美运营商,AT&amp;amp;amp;T的认证分类与认证内容分享

    在数字化日益深入的今天,通信技术的稳定与安全对于个人、企业乃至整个国家都至关重要。作为北美通信领域的领军者,AT&amp;T一直致力于为用户提供高效、可靠的通信服务。而在这背后,AT&amp;T
    的头像 发表于 06-05 17:27 160次阅读
    解读北美运营商,AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T的认证分类与认证内容分享

    浪潮信息存储平台的&amp;quot;南征北战&amp;quot;:释放数据价值的核心力量

    刘希猛以"数聚向新 共赢未来"为主题,结合当前对数据价值释放的迫切需求,对构建相适应的先进存储基础设施进行了全面而详尽的分析。  "关键在于存储基础设施的平台化。" 刘希猛说。 开启"南征北战"新时代:平台型存储的变革之路 近年来,浪潮信息基于
    的头像 发表于 06-04 16:41 136次阅读

    浪潮信息发布企业大模型开发平台&amp;quot;元脑企智&amp;quot;EPAI,加速AI创新落地

    北京2024年4月18日 /美通社/ -- 4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息发布企业大模型开发平台"
    的头像 发表于 04-18 21:21 256次阅读
    <b class='flag-5'>浪潮信息</b>发布企业大模型开发平台&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;元脑企智&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;EPAI,加速AI创新落地

    2024CCLTA | &amp;quot;智&amp;quot;领检验,&amp;quot;慧&amp;quot;聚山城

    (CCLTA2024)在重庆拉开帷幕。展会上,贝克曼库尔特分享了"智慧检验"、"疾病管理"、"创升中国"下的重要力作,包括全自动化学发光免疫分析DxI800、全自动生化分析仪AU5800、微生物鉴定
    的头像 发表于 04-07 18:19 935次阅读
    <b class='flag-5'>2024</b>CCLTA | &<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;领检验,&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;慧&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;聚山城

    浪潮信息&amp;quot;源2.0&amp;quot;大模型YuanChat支持英特尔最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息与英特尔正式宣布,浪潮信息"源2.0系列基础大模型"已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速度提升100
    的头像 发表于 03-27 22:52 250次阅读
    <b class='flag-5'>浪潮信息</b>&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;源2.0&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;大模型YuanChat支持英特尔最新商用AI PC

    科沃斯扫地机器人通过TÜV莱茵&amp;quot;防缠绕&amp;quot;和&amp;quot;高效边角清洁&amp;quot;认证

    3月15日,在2024中国家电及消费电子博览会(AWE)上,国际独立第三方检测、检验和认证机构德国莱茵TÜV大中华区(简称&quot;TÜV莱茵&quot;)为科沃斯两款扫地机器人(型号:DDX14、DDX11)
    的头像 发表于 03-17 10:49 506次阅读

    Open RAN的未来及其对AT&amp;amp;T的意义

    3月14日消息,在“Connected America 2024”会议上,AT&amp;T高级副总裁兼网络首席技术官Yigal Elbaz讨论了Open RAN 的未来及其对AT&amp;T的意义。
    的头像 发表于 03-14 14:40 355次阅读

    浪潮信息首提&amp;quot;高质量算力&amp;quot; 从五大特征来定义

    ,清华大学全球产业研究院副院长李东红,中国信通院产业与规划研究所副总工程师王青,浪潮元脑首席技术官张东及众多行业CIO等算力产学研用专家出席论坛,共同就推进算力高质量发展议题进行研讨。 算力高质量发展与应用高端论坛 会上,浪潮信息首次提出"高
    的头像 发表于 12-28 15:34 309次阅读
    <b class='flag-5'>浪潮信息</b>首提&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;高质量算力&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>; 从五大特征来定义

    R&amp;amp;S携手Skylo Technologies增强非地面网络(NTN)测试服务

    罗德与施瓦茨(以下简称&quot;R&amp;S公司&quot;)携手Skylo Technologies打造用于Skylo非地面网络(NTN)的设备验收方案。
    的头像 发表于 10-20 09:50 477次阅读

    R&amp;amp;S针对FMCW雷达推出超短距离模拟功能

    罗德与施瓦茨(以下简称&quot;R&amp;S公司&quot;)的雷达测试系统通过模拟真实的驾驶场景,从而测试基于雷达的高级驾驶辅助系统(
    的头像 发表于 10-20 09:48 979次阅读

    R&amp;amp;S推出新的W和D频段射频专用测试解决方案

    为支持毫米波和亚太赫兹前沿研究,罗德与施瓦茨(以下简称&quot;R&amp;S公司&quot;)继续推出先进的射频测试测量解决方案。
    的头像 发表于 10-11 12:31 629次阅读

    NVIDIA Research 在 CVPR 上赢得自动驾驶挑战赛并获得创新奖

    新研究成果带来实现安全自动驾驶系统所需的先进 3D Occupancy 预测。 NVIDIA 以自动驾驶开发大赛 3D Occupancy 预测挑战
    的头像 发表于 08-24 17:10 355次阅读
    NVIDIA Research 在 <b class='flag-5'>CVPR</b> 上赢得<b class='flag-5'>自动驾驶</b><b class='flag-5'>挑战赛</b>并获得创新奖

    你使用shell脚本中的2&amp;gt;&amp;amp;1了吗?

    run_cmax > ./starrc_cmax.logs 2>&amp;1中的 2>&amp;1是啥意思?
    的头像 发表于 07-30 14:44 1310次阅读

    芯片工艺的&amp;quot;7nm&amp;quot; 、&amp;quot;5nm&amp;quot;到底指什么?

    近几年,芯片产业越来越火热,一些行业内的术语大家也听得比较多了。那么工艺节点、制程是什么,&quot;7nm&quot; 、&quot;5nm&quot;又是指什么?
    的头像 发表于 07-28 17:34 6386次阅读
    芯片工艺的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;7nm&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>; 、&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;5nm&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;到底指什么?