0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

黑芝麻智能端到端算法参考模型公布

黑芝麻智能 来源:黑芝麻智能 2024-12-03 12:30 次阅读

黑芝麻智能计划推出支持华山及武当系列芯片的端到端算法参考方案。该方案采用One Model架构,并在决策规划单元引入了VLM视觉语言大模型和PRR行车规则的概率化表征子模块,进一步提升了智驾系统的决策规划能力。

最近一两年,“端到端”是自动驾驶领域最热门的话题,不管是整车企业还是自动驾驶公司,开发布会几乎言必提“端到端”,整个行业进一步拥抱AI技术

自动驾驶系统是一个软、硬件高度耦合的系统,当软件算法跨入端到端的时代,如何在不同算力的芯片都能够发挥出足够好的性能?

作为智能汽车计算芯片的引领者,黑芝麻智能从成立之初就意识到了软硬一体的重要性,在开发芯片的同时也组建团队对智驾算法进行研究,保证产品能够满足当下和未来数年的算法发展需求。

黑芝麻智能计划推出支持华山及武当系列芯片的端到端算法参考方案。该方案采用One Model架构,并在决策规划单元引入了VLM视觉语言大模型和PRR行车规则的概率化表征子模块,进一步提升了智驾系统的决策规划能力。

该方案分为标准版和高阶版两个版本。前者在单颗武当C1200家族中算力平台上即可部署,而后则可在即将推出的华山A2000家族中发挥全部实力。

采用One Model架构,最大化信息传递

现阶段量产的端到端系统,相当一部分采用了分段式架构,即将端到端系统分成几个不同的模块级联而成。虽然这些模块也使用AI模型进行工作,但各模块之间仍存在人为定义的接口来传输数据,这就必然导致有一定的信息损失,加上不同模块经常采用独立训练的模式,其效果并非全局最优。

黑芝麻智能的端到端智驾系统,一步到位采用了One Model的架构。一端可输入摄像头、激光雷达、4D毫米波雷达、导航地图等信息,另一端直接输出驾驶决策所需要的信息,即本车的预期轨迹。

36bf6346-b091-11ef-93f3-92fbcf53809c.png

黑芝麻智能端到端智驾系统的总体架构

具体到模型内部,其可以分为BEV编码器和决策(轨迹预测)两个神经网络单元。

BEV编码的工作过程中,车外摄像头或激光雷达、4D 毫米波雷达等各类传感器的数据进入 ResNet 和 FPN 等主干网络,提取并融合多层特征,生成多尺度特征金字塔。经过几何变换,特征图对齐成俯视视角(BEV),实现统一的空间表示。

随后,系统通过多尺度时序聚合将当前与历史 BEV特征融合,减少噪声干扰,增强动态物体感知精度和系统鲁棒性,最终生成特征图(Feature Maps)传递至决策单元,用于生成车辆的预期行驶轨迹。

BEV和决策两个神经网络单元之间传递的是特征图(Feature Maps)。由于这些基础特征图没有人为定义的接口和处理过程,所以信息可以更为原始和完整地传递,以便于网络进行优化和决策。

与此同时,用Feature Maps将两个单元进行连接,还可以以back-propagation反向传播的方式——即通过计算最终输出的轨迹与实际目标之间的误差,然后将该误差反向传播到决策和BEV单元——来进行两个神经网络单元的联合训练和参数调优。

通过前面的分析可以看出,黑芝麻智能的One Model架构既解决了多模块之间可能存在的信息传递损耗问题,又实现了感知和决策单元的联合训练,实际效果会更佳优秀。

决策单元引入多源输入,提升轨迹预测准确性

在此基础之上,黑芝麻智能团队还更进一步,通过引入VLM(视觉语言大模型)和规则的概率化表征(Probabilistic Representation of Rules,以下简称 PRR)两个模块,来进一步提升端到端系统决策的准确性和灵活性。

VLM 模型基于开源 VLM 模型改进而来,该模型可同时接收图像和语言输入信息(比如用户的导航指令),然后通过 Transformer 结构中的交叉注意力机制将视觉和语言两种模态的信息相互关联,从而让模型更深层地理解当前的场景,并以符号特征的形式,将对于场景的理解输入到决策单元中。

例如,当系统识别到行人在斑马线上移动的视觉信息,VLM 可以通过语言规则的匹配,理解这个场景是“行人在过马路”,并且知道此时应该停车或者减速——将这种信息传递给轨迹预测模块,显然能够帮助其做出更加正确的驾驶决策。

除了有 VLM 子模块的帮助,决策单元还有行车规则的概率化表征模块(PRR)提供信息。

36f80dc2-b091-11ef-93f3-92fbcf53809c.png

规则的概率化表征模块

该模块用于将人类的驾驶常识和交通规则转化为自动驾驶系统可理解的概率分布,再通过概率化轨迹采样生成符合交通规则的候选轨迹,并为每个选项赋予相应的概率权重。例如,在交叉路口,系统可以生成“等待”“缓慢通过”等符合规则的选项,并赋予相应的优先级。

此外,该模块还包含规则的语言描述部分,将交通规则和驾驶指令编码为语义特征,使其能够被决策模块理解和应用。例如,红灯停车或右转让行的规则会生成特定语义向量。

PRR输出的两种信息均会进入到决策单元,与BEV单元输出的特征图、VLM输出的场景理解特征互相融合,最终生成一条最佳的目标行驶轨迹。

最后补充一点,VLM和PRR模块本质上是端到端系统的增强型“外挂”,它们额外引入了类人的对于场景的综合理解能力,以及常识和交规的语义表征,从而在扩展轨迹决策能力的同时维持了端到端系统的整体工作原理, 其本质上相当于一个功能增强了的One Model架构。

用扩散模型生成轨迹,应对不同环境

介绍完各个单元和模块后,我们再来重点看一下这套端到端系统的核心——决策部分,到底是如何进行轨迹预测的。

这里主要使用了扩散模型这种生成式模型。工作时,系统会首先生成多个可能的候选轨迹,然后通过逐层多次去噪筛选出最优轨迹。例如,在行驶过程中,如果系统预测到前方车辆可能变道,扩散模型会生成多个候选路径,并在去噪过程中逐步排除高风险的路径,确保最终选择一条安全的行驶路径。

373b8b60-b091-11ef-93f3-92fbcf53809c.png

基于扩散模型的轨迹预测模块

这种轨迹生成方法具备多种优势。首先,扩散模型采用逐步迭代的去噪过程,每一步都对预测进行细化,从而逐渐优化输出。相比于传统一次性生成结果的模型,扩散模型能够更精细地控制输出,使轨迹预测更加平滑和自然。这一特性尤其适用于动态环境中的轨迹预测,确保模型在复杂场景中生成的路径符合实际行驶需求。

其次,扩散模型的核心设计是去噪。这使其在面对噪声数据或带有随机扰动的输入时,依然能够稳定地生成合理的轨迹,让系统在应对复杂环境时具备更强的鲁棒性。

最后,该模型在处理长尾场景时表现出色,比如极端天气、异形障碍物、突然横穿的行人等,增加了智驾系统的泛化能力。

C1200可快速部署, A2000将大显身手

黑芝麻智能的端到端参考方案,以其创新的One Model架构和多模块协同设计,成功解决了传统分段式端到端系统中信息损耗、训练分离等核心问题。在决策单元引入VLM和PRR模块后,这套方案进一步提升了决策能力,无论在场景理解、轨迹规划,还是动态环境适应方面,都达到了新的高度。这种设计不仅提升了端到端系统的整体性能,也为行业开创了更智能、更高效的技术路径。

当然,再先进的算法也离不开芯片的支持。黑芝麻智能在设计端到端参考方案的同时,充分考虑了软硬件结合的实际需求,使其方案可以灵活适配不同性能的芯片平台。

黑芝麻智能武当C1200家族芯片

不含 VLM 和 PRR 模块的标准版方案,可在黑芝麻智能现有的武当C1200家族芯片上高效部署,满足车企和Tier1等合作伙伴基于算法的参考方案快速适配硬件并开发量产端到端系统的需求;而随着未来黑芝麻智能华山A2000家族芯片的推出,则可以用超高算力支持包括VLM和PRR模块的高阶版端到端系统的部署,为终端客户提供更高性能的智驾体验,并为L3和L4级自动驾驶做好准备。

未来,随着端到端架构的不断完善和芯片技术的迭代提升,黑芝麻智能将继续引领行业发展,为中国智能汽车产业的加速崛起贡献更多智慧与力量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4644

    浏览量

    93670
  • 自动驾驶
    +关注

    关注

    787

    文章

    13992

    浏览量

    167632
  • 黑芝麻智能
    +关注

    关注

    1

    文章

    176

    浏览量

    3433

原文标题:黑芝麻智能端到端算法参考模型公布,一文了解技术亮点

文章出处:【微信号:BlackSesameTech,微信公众号:黑芝麻智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    黑芝麻智能芯片加速DeepSeek模型推理

    近日,黑芝麻智能宣布,其武当C1200家族芯片已成功完成DeepSeek模型推理的部署,而A2000芯片也将全面支持基于DeepSeek的多模态大模型推理。这一消息标志着
    的头像 发表于 02-14 15:04 257次阅读

    黑芝麻智能芯片全面兼容DeepSeek模型推理

    目前,黑芝麻智能武当C1200家族芯片已经完成DeepSeek模型的部署,A2000也将全面支持基于DeepSeek的多模态大模型。 伴随DeepSeek等AI应用全面爆发,作为AI可
    的头像 发表于 02-14 11:27 155次阅读

    黑芝麻智能与Dirac签署合作备忘录

    1月21日,黑芝麻智能与Dirac签署合作备忘录,双方将基于黑芝麻智能武当C1200家族芯片共同探索汽车高品质音频体验的创新。
    的头像 发表于 01-21 10:48 202次阅读

    黑芝麻智能与Nullmax联袂发布A2000多模态大模型智驾方案

    方案以黑芝麻智能A2000芯片为核心,结合了Nullmax在自动驾驶算法和技术方面的深厚积累,创新性地采用了
    的头像 发表于 01-14 11:42 305次阅读

    黑芝麻智能与Nullmax发布量产级高阶智驾功能

    黑芝麻智能与Nullmax达成重要合作里程碑,双方基于黑芝麻智能武当C1200家族芯片推出BEV无图方案。
    的头像 发表于 01-10 16:30 298次阅读

    黑芝麻智能、NESINEXT、傅利叶联合发布“灵巧手”

    黑芝麻智能、NESINEXT以及傅利叶联合展示基于黑芝麻智能C1200家族芯片的通用人形机器人“灵巧手”具身智能硬件产品。
    的头像 发表于 01-09 15:13 294次阅读

    黑芝麻智能与Nullmax推出A2000多模态大模型智驾方案

    黑芝麻智能宣布与Nullmax共同发布基于华山系列最新一代芯片A2000的多模态大模型智驾方案,以创新独特的
    的头像 发表于 01-09 09:51 198次阅读

    黑芝麻智能与阿里云达成深度合作

    黑芝麻智能与阿里云达成深度合作,已共同完成大模型车载芯片级适配。
    的头像 发表于 01-03 14:31 296次阅读

    黑芝麻智能推出华山A2000家族芯片平台

    平台承袭黑芝麻智能华山产品线的使命,以更高算力、更强性能赋能汽车行业,加速高阶智能驾驶成为标配,打造全场景通识智驾标杆。 智驾终途,高阶智驾驶向全场景通识智驾 在智能驾驶技术的浪潮中,
    的头像 发表于 12-30 15:46 349次阅读

    湖北省领导莅临黑芝麻智能调研

    黑芝麻智能引领智能汽车芯片发展,湖北省省长王忠林调研并肯定企业贡献。
    的头像 发表于 09-24 16:39 494次阅读

    黑芝麻智能正式加入智能网联汽车“车路云一体化”应用建设

    黑芝麻智能目前已围绕华山A1000芯片形成车-路全栈能力,成为国内少数可同时交付车、路双感知和车路协同解决方案的供应商之一。
    的头像 发表于 07-27 11:35 895次阅读

    小鹏汽车发布模型

    小鹏汽车近日宣布,其成功研发并发布了“国内首个量产上车”的模型,该模型可直接通过传感器输入内容来控制车辆,标志着
    的头像 发表于 05-21 15:09 781次阅读

    黑芝麻智能与腾讯云合作共同打造高性价比的智能驾驶系统解决方案

    黑芝麻智能和腾讯云将通过软硬一体的合作模式,共同打造高性价比的智能驾驶系统解决方案,推动云端、车结合的自动驾驶芯片生态合作,打造行业示范性创新案例。
    的头像 发表于 04-24 16:50 962次阅读
    <b class='flag-5'>黑芝麻</b><b class='flag-5'>智能</b>与腾讯云合作共同打造高性价比的<b class='flag-5'>智能</b>驾驶系统解决方案

    黑芝麻更新赴港IPO进程

    黑芝麻智能港股上市进程取得新进展。经过九个月的等待,黑芝麻智能最近更新了其在港交所的IPO文件。该公司作为车规级计算SoC及智能汽车解决方案
    的头像 发表于 03-27 16:16 747次阅读

    黑芝麻智能再次冲击港交所IPO

    黑芝麻智能公司再次向港交所主板递交了IPO上市申请,这已是自2023年6月30日以来第二次递表。黑芝麻智能专注于提供车规级计算SoC以及基于SoC的
    的头像 发表于 03-26 14:01 551次阅读