0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

商汤科技SenseTime 来源:未知 2023-06-22 06:15 次阅读
一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR 2023闪亮的成绩单。6月18日-22日,全球计算机视觉盛会CVPR 2023(Computer Vision and Pattern Recognition)在加拿大温哥华举行。

本届CVPR论文投稿总量达9155篇,最终共有2369篇论文被接收。最佳论文候选为12篇,接收率仅为0.13%。商汤及联合实验室2篇论文登上最佳论文候选名单(Award Candidate),其中自动驾驶研究论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)斩获本届CVPR最佳论文奖(Best Paper Award)

这是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 标志着自动驾驶技术的重要突破, 为自动驾驶技术与产业的发展提出了新的方向。

CVPR 2023最佳论文,自动驾驶研究获重要突破 自动驾驶技术高度复杂,需要融合多学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。自动驾驶还需要适应不同的道路规则和交通文化,与车辆和行人进行良好交互,以实现高度可靠和安全的自动驾驶系统。

大部分自动驾驶相关的工作都聚焦在具体的某个模块,关于框架性的研讨则相对匮乏。

商汤及联合实验室CVPR 2023 Best Paper提出的自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于Transformer 的端到端网络框架下,更高效契合了“多任务”和“高性能”的特点,取得自动驾驶技术研究重要突破。

623268e6-1080-11ee-962d-dac502259ad0.jpg自动驾驶UniAD框架对比(a)模块化(b)多任务模块(c)端到端自动驾驶模块

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,UniAD是业内首个感知决策一体化的端到端自动驾驶解决方案,并且整体系统和性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。

端到端的优化在多项关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。

625cb90c-1080-11ee-962d-dac502259ad0.jpg点击可查看高清图

UniAD 是一项极具创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。

随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来能推动实现更高阶的自动驾驶人工智能

CVPR 2023最佳论文候选,加速推动AIGC时代真实感3D内容生成

面向真实 3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题。由于缺乏大规模的真实扫描三维数据库,最近在三维物体建模方面的进展大多依赖于合成数据集。

为促进现实世界中3D感知、重建和生成的发展,商汤及联合实验室CVPR 2023 Best Paper候选论文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一个具有大规模高质量真实扫描3D物体的大型词汇3D物体数据集,覆盖近200个类别、约6000个三维物体数据,包括高精表面网格、点云、多视角渲染图像和实景采集的视频,借助专业扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D是目前学界最大的真实世界三维扫描模型数据集,为未来三维视觉研究提供了广阔空间。

利用该数据集,研究人员精心探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,验证其从感知、重建、到生成领域的开放应用前景,有望在AIGC 时代推动真实感3D生成方面发挥至关重要的作用。 持续引领前沿创新,是商汤在以大装置SenseCore和大模型为核心的AI基础设施领域长期投入,并坚持产学研协同创新的成果。

王晓刚教授认为,在大算力、大数据的支撑下,大模型将以更强大的通用能力引发人工智能领域的巨大变革,同时也会拓展我们的研究视野,激发新一轮研究范式革新。

自今年4月初“商汤日日新SenseNova”大模型体系公布以来,商汤的大模型已在气象预报、遥感解译、开放环境中的决策问题等领域取得了诸多突破性成就。未来,商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。

62a784e6-1080-11ee-962d-dac502259ad0.gif

相关阅读,戳这里

《CVPR 2022丨商汤再创佳绩,用技术创新直击行业痛点》

62c2e84e-1080-11ee-962d-dac502259ad0.jpg


原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    509

    浏览量

    36088

原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一体化自动气象监测系统:全天候守护,24小时不间断监测

    一体化自动气象监测系统以其全天候守护、24 小时不间断监测的特点,为我们的生产生活提供了准确、及时的气象信息,在各个领域都发挥着重要的作用。相信在未来,随着技术的不断进步,一体化自动
    的头像 发表于 11-29 09:22 250次阅读
    <b class='flag-5'>一体化</b><b class='flag-5'>自动</b>气象监测系统:全天候守护,24小时不间断监测

    聊聊自动驾驶离不开的感知硬件

    自动驾驶飞速发展,绕不开感知决策和控制决策的经典框架,而感知作为自动驾驶汽车“感官”的重要组成
    的头像 发表于 08-23 10:18 494次阅读

    《嵌入式机电一体化系统设计与实现》读后感

    先给大家看看封面哦 再看居然还有签名呢 还贴心的送了书签哦,爱了爱了 在阅读了曾庆祥教授所著的《嵌入式机电一体化系统设计与实现》书后,我深感收获颇丰,对嵌入式系统与机电一体化系统的设计与实现有了
    发表于 08-21 08:45

    揭秘! 经纬恒润“车路云一体化”方案研发服务背后的科技驱动力

    随着高级别智能驾驶技术的飞速发展,自动驾驶与路侧基础设施协同合作已成为行业内的又热点。我国率先提出以“车路云一体化”为核心的战略布局,国家政策密集出台,地方试点积极推进,行业标准日趋
    的头像 发表于 08-13 08:00 927次阅读
    揭秘! 经纬恒润“车路云<b class='flag-5'>一体化</b>”方案研发服务背后的科技驱动力

    FPGA在自动驾驶领域有哪些优势?

    对实时性要求极高,任何延迟都可能导致安全事故。FPGA的硬件特性使得其能够实现极低的延迟,确保自动驾驶系统能够实时响应环境变化并做出正确的决策。 高能效比: 尽管FPGA的功耗相对于些专用处理器可能
    发表于 07-29 17:11

    FPGA在自动驾驶领域有哪些应用?

    是FPGA在自动驾驶领域的主要应用: 感知算法加速 图像处理:自动驾驶中需要通过摄像头获取并识别道路信息和行驶环境,这涉及到大量的图像处理任务。FPGA在处理图像上的运算速度快,可
    发表于 07-29 17:09

    浪潮信息获CVPR2024自动驾驶挑战赛&quot;Occupancy&amp; Flow&quot;冠军

    "算法模型以48.9%的出色成绩斩获占据栅格和运动估计(Occupancy Flow)赛道,是CVPR 2024自动驾驶国际挑战赛最受关注的赛道,聚焦
    的头像 发表于 06-25 20:29 374次阅读
    浪潮信息获<b class='flag-5'>CVPR</b>2024<b class='flag-5'>自动驾驶</b>挑战赛&quot;Occupancy&amp; Flow&quot;冠军

    康谋分享 | 自动驾驶联合仿真——功能模型接口FMI(

    功能模型接口是个开放且独立于工具的标准,包含C-API接口、XML描述文件和可交换的功能模型单元,提供容器模型,便于在不同平台上重复使用
    的头像 发表于 06-12 13:07 1633次阅读
    康谋分享 | <b class='flag-5'>自动驾驶</b><b class='flag-5'>联合</b>仿真——功能<b class='flag-5'>模型</b>接口FMI(<b class='flag-5'>一</b>)

    什么是机电一体化?它有哪些应用?

    在科技飞速发展的今天,机电一体化技术已成为现代工业生产的核心驱动力之。它融合了机械工程、电子技术、计算机技术、信息技术等多学科的理论与技术,实现了机械与电子的有机结合,极大地推动了制造业的智能
    的头像 发表于 06-11 14:02 4951次阅读

    商汤科技联合海通证券发布业内首个面向金融行业的多模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的多模态全栈式大
    的头像 发表于 04-26 09:48 470次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>联合</b>海通证券发布业内<b class='flag-5'>首个</b>面向金融行业的多模态全栈式大<b class='flag-5'>模型</b>

    未来已来,多传感器融合感知自动驾驶破局的关键

    驾驶的关键的是具备人类的感知能力,多传感器融合感知正是自动驾驶破局的关键。昱感微的雷视一体多传感器融合方案就好像
    发表于 04-11 10:26

    自动驾驶已成现实?赛思时间同步服务器赋能北京市高级别自动驾驶示范区,为自动驾驶提供中国方案

    赛思时间同步服务器赋能全球首个“车路云一体化”高级别自动驾驶示范区,为自动驾驶提供中国方案!北京市高级别自动驾驶示范区的“中枢神经”-云控基
    的头像 发表于 03-22 09:30 1053次阅读
    <b class='flag-5'>自动驾驶</b>已成现实?赛思时间同步服务器赋能北京市高级别<b class='flag-5'>自动驾驶</b>示范区,为<b class='flag-5'>自动驾驶</b>提供中国方案

    商汤科技AI技术助力肝脏诊疗一体化

    商汤科技在肝脏诊疗领域积极探索创新AI技术的应用,成功推出了SenseCare®腹部智能临床方案,这方案涵盖了肝脏CT、MR多模态影像辅助诊断、手术规划等多个环节,为肝脏诊疗一体化
    的头像 发表于 03-19 10:24 652次阅读

    什么是一体化PFC模块

    格平科技与脱离传统PFC模块定义,推出一体化的PFC 模块,无需加外围电路,上电即可使用
    的头像 发表于 02-25 10:19 769次阅读
    什么是<b class='flag-5'>一体化</b>PFC模块

    什么是通感算一体化?通感算一体化的应用场景

    通感算一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了些典型的应用场景。 智能家居 通感算一体化利用基站或者Wi-Fi路由器为智能家居系统提供更加丰富的功能。
    发表于 01-18 16:12 1.1w次阅读
    什么是通感算<b class='flag-5'>一体化</b>?通感算<b class='flag-5'>一体化</b>的应用场景