0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

地平线科研论文入选国际计算机视觉顶会ECCV 2024

地平线HorizonRobotics 来源:地平线HorizonRobotics 2024-07-27 11:10 次阅读

近日,地平线两篇论文入选国际计算机视觉顶会ECCV 2024,自动驾驶算法技术再有新突破。

ECCV(European Conference on Computer Vision,即欧洲计算机视觉国际会议),是计算机视觉领域中最顶级的会议之一,与ICCV(International Conference on Computer Vision)和CVPR(Conference on Computer Vision and Pattern Recognition)并称为计算机视觉领域的“三大顶会”。ECCV每两年举行一次,吸引了全球顶尖的研究人员、学者和业界专家,分享最新的研究成果与技术创新。

聚创新之力 答智驾课题

本次地平线被录用的2篇论文是:

1、Lane Graph as Path: Continuity-preserving Path-wise Modeling for Online Lane Graph Construction

(《LaneGAP:用于在线车道图构建的连续性路径建模》)

论文链接:https://arxiv.org/abs/2303.08815

2、Occupancy as Set of Points

(《OSP:基于点集表征的占据网格预测》)

论文链接:https://arxiv.org/abs/2407.04049

车道图构建新方案:

端到端学习路径,大幅提升预测规划性能

在线车道图构建是自动驾驶领域一项有前途但具有挑战性的任务。LaneGAP 是一种车道图构建新方法,将端到端矢量地图在线构建方法 MapTR(入选深度学习顶会ICLR spotlight论文)拓展到道路拓扑建模,能够大幅提升预测规划性能,应对各种复杂交通状况。LaneGAP 和 MapTR 相关工作已经在地平线高阶智驾系统SuperDrive中落地应用。

c3480548-4b33-11ef-b8af-92fbcf53809c.jpg

具体而言,以前的方法通常在像素或片段级别对车道图进行建模,并通过逐像素或分段连接恢复车道图,这会破坏车道的连续性。作者提出一种基于路径的在线车道图构建方法—— LaneGAP,它采用了端到端学习路径,并通过 Path2Graph 算法恢复车道图。LaneGAP在具有挑战性的 nuScenes 和 Argoverse2 数据集上定性和定量地证明了 LaneGAP 优于传统的基于像素和基于片段的方法。丰富的可视化效果显示 LaneGAP 可以应对各种复杂交通状况。

Occupancy新突破:

全新视角,性能更强大,计算更灵活

OSP提出了全新视角下的自动驾驶场景建模算法——稀疏点集占据网格预测方法,通过与2D图像特征交互的点查询,建立了一种新的基于点的占用表示,可以全面理解3D场景,并且框架更灵活,性能更强大。

c35a9f64-4b33-11ef-b8af-92fbcf53809c.png

本文探索了利用多视角图像进行3D占据网格预测的新方法,称为“点集占据网格”。现有方法倾向于利用BEV表征进行占据网格预测,因此很难将注意力集中在特殊区域或感知范围之外的区域。相比之下,本文提出了Points of Interest (PoIs) 来表示场景,并提出了 OSP,一种基于点的 3D 占用预测的新框架。得益于点集表征的灵活性,OSP 与现有方法相比实现了强大的性能,并且在训练和推理适应性方面表现出色:可以预测感知边界外的范围;可以与基于体特征的方法集成以提升性能。在Occ3D nuScenes占用基准上的实验表明,OSP具有强大的性能和灵活性。

除了这两篇斩获ECCV 2024的最新成果,地平线在ICCV 2023上提出的VAD也有创新进展。VADv2首次提出基于概率建模的多模态决策端到端自动驾驶大模型,在闭环榜单Carla Town05 Benchmark上达到SOTA的端到端自动驾驶规划性能。

此前,VAD初步探索了基于矢量化场景表征的端到端自动驾驶算法框架,在此基础上,VADv2首次将多模态概率规划引入端到端自动驾驶,用于解决判决式模型无法建模决策的天然多模态特性的问题,从而有效提升决策的准确率。VADv2以数据驱动的范式从大量驾驶数据中端到端学习驾驶策略,在Carla闭环榜单上,相比于此前的方案,VADv2大幅提升驾驶评分,实现SOTA性能,在无需规则后处理的情况下也能有良好的驾驶表现。

c376e6c4-4b33-11ef-b8af-92fbcf53809c.jpg

于7月21日-27日,正在奥地利维也纳举办的2024国际机器学习大会(ICML 2024)上,地平线被ICML 2024接收的最新工作Vision Mamba(简称Vim)也受邀做了分享。Vision Mamba是一种新的通用视觉主干模型,相比现有的视觉Transformer,在性能上有显著提升,是接替Transformer的下一代视觉基础模型。

c38f07b8-4b33-11ef-b8af-92fbcf53809c.jpg

Vision Mamba使用双向状态空间模型(SSM)对图像序列进行位置嵌入,并利用双向SSM压缩视觉表示。在ImageNet分类、COCO目标检测和ADE20k语义分割任务中,Vim相比现有的视觉Transformer(如DeiT)在性能上有大幅提升,同时在计算和内存效率上也有显著改进。例如,在进行分辨率为1248×1248的批量推理时,Vim比DeiT快2.8倍,GPU内存节省86.8%。这些结果表明,Vim能够克服在高分辨率图像理解中执行Transformer样式的计算和内存限制,具有成为下一代视觉基础模型主干的潜力。

地平线「你好,开发者」直播预告

为了让智驾开发者更深入地了解这些最新的研究成果与算法创新,地平线策划推出2024年「你好,开发者」自动驾驶技术专场,邀请到地平线各位技术专家进行直播分享。敬请关注!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    8

    文章

    1680

    浏览量

    45797
  • 自动驾驶
    +关注

    关注

    780

    文章

    13425

    浏览量

    165040
  • 地平线
    +关注

    关注

    0

    文章

    319

    浏览量

    14797

原文标题:地平线自动驾驶算法新突破,科研论文入选学术顶会 ECCV 2024

文章出处:【微信号:horizonrobotics,微信公众号:地平线HorizonRobotics】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    地平线Journey 3的电源设计

    电子发烧友网站提供《地平线Journey 3的电源设计.pdf》资料免费下载
    发表于 09-04 10:48 0次下载
    <b class='flag-5'>地平线</b>Journey 3的电源设计

    Nullmax视觉感知能力再获国际顶级学术会议认可

    日前,欧洲计算机视觉国际会议 ECCV 2024公布论文录用结果,Nullmax感知团队的目标检
    的头像 发表于 09-02 14:07 221次阅读

    地平线征程家族出货量破600万,智驾计算方案领跑市场

    近日,地平线征程家族传来振奋人心的消息,其车载智能计算方案的出货量已正式突破600万套大关,再次刷新行业记录,彰显了地平线在智能驾驶领域的强劲实力与高速增长态势。
    的头像 发表于 08-22 17:17 497次阅读

    芯动力科技论文入选ISCA 2024,与国际巨头同台交流研究成果

    Processor for Edge Computing》(RPP芯片架构)成功被第51届计算机体系结构国际研讨(ISCA 2024)的Industry Track收录。此外,我们
    的头像 发表于 07-18 11:16 244次阅读
    芯动力科技<b class='flag-5'>论文</b><b class='flag-5'>入选</b>ISCA <b class='flag-5'>2024</b>,与<b class='flag-5'>国际</b>巨头同台交流研究成果

    机器视觉计算机视觉有什么区别

    机器视觉计算机视觉是两个密切相关但又有所区别的概念。 一、定义 机器视觉 机器视觉,又称为计算机
    的头像 发表于 07-16 10:23 242次阅读

    计算机视觉的工作原理和应用

    图像和视频中提取有用信息,进而进行决策和行动。自1960年代第一批学术论文问世以来,计算机视觉技术已经取得了长足的发展,并在多个领域展现出巨大的应用潜力和价值。
    的头像 发表于 07-10 18:24 964次阅读

    计算机视觉属于人工智能吗

    属于,计算机视觉是人工智能领域的一个重要分支。 引言 计算机视觉是一门研究如何使计算机具有视觉
    的头像 发表于 07-09 09:11 396次阅读

    计算机视觉的主要研究方向

    计算机视觉(Computer Vision, CV)作为人工智能领域的一个重要分支,致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等技术的快速发展,计算机
    的头像 发表于 06-06 17:17 457次阅读

    地平线发布新一代Horizon SuperDrive™全场景智能驾驶解决方案

    4月24日,地平线举办“征程所向,向高而行”——2024智驾科技产品发布。立足于智能驾驶时代,地平线凭借对软硬结合全栈技术理念的前瞻预判和深厚积累,重磅发布新一代车载智能
    的头像 发表于 04-25 09:17 1175次阅读
    <b class='flag-5'>地平线</b>发布新一代Horizon SuperDrive™全场景智能驾驶解决方案

    地平线提交香港IPO申请

    智能驾驶计算方案提供商“地平线”正式递交港股上市申请。据其公开文件,地平线在2023年实现了15.5亿元的营收,同比显著增长71.3%,毛利达到10.94亿元,毛利率高达70.5%。
    的头像 发表于 03-27 16:11 510次阅读

    地平线正式开源Sparse4D算法

    地平线将业内领先的纯视觉自动驾驶算法——Sparse4D系列算法开源,推动行业更多开发者共同参与到端到端自动驾驶、稀疏感知等前沿技术方向的探索中。目前,Sparse4D算法已在GitHub平台上线,开发者可关注地平线GitHub
    的头像 发表于 01-23 10:18 574次阅读

    地平线再获奇瑞协同创新特别贡献奖

    在奇瑞汽车2024供应链生态圈年会上,地平线荣获奇瑞汽车颁发的“协同创新特别贡献奖”,这也是地平线连续第二年荣获该奖项,地平线总裁陈黎明博士受邀出席并代表公司获颁奖项。与此同时,陈黎明
    的头像 发表于 01-22 11:16 1012次阅读

    地平线将推出新一代征程6车载智能计算方案

    地平线正式宣布,将于2024年4月推出新一代征程6车载智能计算方案,并在同年第四季度完成首批量产车型的交付。这款即将推出的征程6是地平线征程家族的全新升维进化产品,具备强大的
    的头像 发表于 01-15 14:33 680次阅读

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-16 16:38 4109次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-15 16:38 336次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?