0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

针对智能驾驶应用,深度学习应该如何落地呢?

高工智能汽车 来源:未知 作者:李倩 2018-07-03 16:53 次阅读

本文由前向启创&CTO张晖介绍了前向启创在TI TDA芯片上,使用深度学习方法,解决智能驾驶感知问题的一些经验。

深度学习以其强大的特征表示能力,已经在许多应用领域中体现出了不俗的性能。而针对智能驾驶应用,深度学习应该如何落地呢?

前向启创&CTO张晖认为,主要存在有两大技术挑战:一是主芯片的选型,二则是针对特定芯片的深度学习算法的设计与实现。

前向启创&CTO张晖,2004年毕业于华中科技大学,获双学士学位;2004-2005年就职于美国安凯微电子,任算法工程师;005-2013年就职于美国ZORAN(CSR/Qualcomm)公司,任算法研发经理;近15年算法芯片化与产品化经验;在ACCV、ICPR等国际会议上发表学术论文多篇;拥有多项中美发明专利。

TI智能驾驶ASIC

针对智能驾驶产品主处理器芯片进行选型,应该将汽车智能驾驶产品的主要诉求——高可靠性与低成本,作为主要参考依据。

从业界角度来看,智能驾驶主芯片可分两大流派,一派为ASIC,将特定的算法计算引擎芯片化,代表企业有如TI、Mobileye、nVidia、Ambarella等;另一派则为FPGA,代表企业有如Xilinx,Altera等。

而ASIC以其定制性,在成本、功耗、算力、弹性、车规、功能安全等级以及量产周期上达到了更好的平衡。

TI(Texas Instuments)自2010年起开始提供针对智能驾驶的ASIC芯片TDA(TIDriverAssist)系列,至今已经迭代到了第四代。

经过多年的演进,TI已经将多项针对智能驾驶的算法逐步芯片化、引擎化,其功能安全等级,也达到了ASIL-C级。

TI的ASIC芯片TDA(TIDriverAssist)系列

TI的智能驾驶芯片以其优异的性价比,已被全球超过15家Tier1、25家OEM主机厂所采用,成功在近100款车型中量产,已累积出货近4千万片。目前前向启创也采用TI ASIC芯片。

深度网络设计

网络模型设计是深度学习应用的关键,如何设计一个能满足产品化要求的智能驾驶感知网络呢?

张晖认为,主要存在着两大关键点,第一需要贴近任务和系统需求,即必须针对智能驾驶系统应用对感知层的需求来进行网络设计,切不可为了使用深度学习而选择深度神经网络

第二需要考虑到芯片嵌入式平台算力受限系统,必须因芯设计,切不可盲目的进行网络堆砌,导致运算量过大,而造成无法部署到芯片上的问题。

从智能驾驶的任务来看,Level2–Level3系统对感知提出了更高的要求,例如AEB-Cross需要检测车辆侧面状态,TJA(TrafficJamAssistance)更需要识别出可通行区域,即FreeSpace,等等。

针对车辆侧面检测,前向启创重新设计了一套FINet网络,将传统的2D-BoundingBox扩展到了3D-BoundingBox,可以对车辆的多个表面进行检测。

前向启创针对车辆侧面检测设计的FINet网络

而针对FreeSpace任务,前向启创重新设计了的FINet可将此任务分解为,对Flat平坦可通行区域;Step路沿台阶;以及Obstacle障碍物三大类目标进行分割。

前向启创针对FreeSpace任务,FINet分解为三大类目标

深度网络优化

常见的深度学习网络都对主芯片的算力提出了比较高的要求。

常见网络在对720P@30fps图像进行推理时,对算力的要求

由上图可看出,大部分网络对算力的要求超过了1Tops,而类似TITDA2x这类低功耗芯片目前达不到1Tops算力要求。所以在网络基础模型设计好后,为了大幅降低模型的GMACS以适应算力受限的芯片平台,就需要针对芯片进行网络的细调整(FineTuning)及优化。

针对TIASIC的芯片架构,前向启创主要采用了两大方法进行网络优化,第一卷积稀疏化,第二8-BIT量化技术。

第一,卷积稀疏化方法是通过调整损失函数,对权重小于动态阈值的卷积核中的系数进行归零处理,再将此稀疏度的张量重新进行调优训练,对已归零处理后的系数不再进行反向传播更新,最后以达到在保证稀疏度的情况下,训练精度没有明显的下降。

两种不同稀疏度的目标函数下,通过调优训练出来的滤波器的核

第二,动态8-BIT量化技术,动态指的是在8-BIT的最大位宽的前提下,尽量高地提高张量的量化精度,即有符号与否,定标值是多少,都随张量的范围而进行动态调整。

在完成以上两步优化后,前向启创的FINet网络在精度下降不到1%的情况下,整体提速了近10倍。

芯片级部署与实现

针对智能驾驶应用,TI的TDA系列芯片采用了多核异构的芯片架构来达到算力与功耗平衡,而其中的子处理器是可配置的,如DSP和EVE等子处理器单元数可以选择,以求针对系统要求,达到更合适的性价比。

整体芯片架构如图所示

多核异构架构的最大优点就是能够将不同类型的计算或控制任务异核化,TITDA系列芯片的设计初衷中,视觉感知的中低层计算任务主要被集中到了DSP和EVE这两类子处理器上:

TITDA系列芯片的设计

EVE作为TI针对智能驾驶应用而专门设计的向量硬件加速器,在同等功耗下,相比于现有其它智能驾驶芯片,每个EVE核能够达到8倍的计算性能的提升。

每个EVE核能够达到8倍的计算性能的提升

针对深度神经网络中最耗时的卷积运算部分,在部署阶段,前向启创主要使用了其中的EVE核来进行计算,利用EVE中的SIMD特性,可以将FINet中的卷积运算部分提速8倍左右。

完成在TI芯片上的部署后,前向启创FINet网络整体上能够达到实时感知的系统性能要求。

在TITDA这类成熟的ASIC上,通过网络设计、网络优化以及芯片部署这三大步,就能基本实现深度神经网络的初步框架。

在后续的产品化过程中,还需根据实际的系统需求,对这三步进行闭环式的迭代,以求达到系统性能与算力的最佳平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100767
  • 智能驾驶
    +关注

    关注

    3

    文章

    2521

    浏览量

    48761
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121165

原文标题:智能驾驶感知产品化:基于TI ASIC深度神经网络的设计与实现 | GGAI经验谈

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Nanopi深度学习之路(1)深度学习框架分析

    学习,也就是现在最流行的深度学习领域,关注论坛的朋友应该看到了,开发板试用活动中有【NanoPi K1 Plus试用】的申请,介绍中NanopiK1plus的高大上优点之一就是“可运行
    发表于 06-04 22:32

    百度深度学习研究院科学家深度讲解人工智能

    的研发经验。在过去的工作中,他发表过论文十余篇,申请中国专利超过100项,其中已经授权的有95项。他曾任职百度深度学习研究院,负责人脸识别方向,曾经多次带领团队在主流的人脸检测、人脸识别竞赛上取得
    发表于 07-19 10:01

      华为云深度学习服务,让企业智能从此不求人

    深度学习服务的发布,大幅降低了企业深度学习训练的技术门槛、性能门槛和数据量门槛,因此,华为云深度学习
    发表于 08-02 20:44

    硅谷组建团队、L3产品落地,想法多多的腾讯自动驾驶

    `日前有消息显示,腾讯在领英发布招聘广告,表示其在加利福尼亚州帕洛阿尔托的汽车驾驶研发团队需要招聘至少九类工程师职位,其中包括移动规划,传感器汇合,车辆智能和机器学习等方面。根据公开信息显示,这些
    发表于 11-13 11:33

    人工智能、数据挖掘、机器学习深度学习的关系

    人工智能、数据挖掘、机器学习深度学习之间,主要有什么关系?
    发表于 03-16 11:35

    深度学习是什么

    创客们的最酷“玩具”  智能无人机、自主机器人、智能摄像机、自动驾驶……今年最令硬件创客们着迷的词汇,想必就是这些一线“网红”了。而这些网红的背后,几乎都和计算机视觉与深度
    发表于 07-19 06:17

    智能驾驶的狂想与现实落地 精选资料分享

    编辑导读:随着人工智能的技术发展,很多领域开始了革命式创新,智能驾驶就是其中的一个典型代表。本篇文章中作者介绍了智能驾驶的发展历程以及行业现
    发表于 07-27 07:45

    智能驾驶域控制器的SoC芯片选型

    1、智能驾驶域控制器的SoC芯片选型随着智能驾驶行业的发展,智能驾驶功能日益复杂,领航高速辅助、
    发表于 08-11 15:55

    人工智能深度学习未来应该如何发展的详细概述

    深度学习从12、13年甚嚣尘上,到如今的尘埃落地,浪潮一再的退去。面对疲软的风口,养肥的猪,人工智能将何去何从?
    的头像 发表于 06-02 10:00 4095次阅读
    人工<b class='flag-5'>智能</b><b class='flag-5'>深度</b><b class='flag-5'>学习</b>未来<b class='flag-5'>应该</b>如何发展的详细概述

    探讨深度学习在自动驾驶中的应用

    深度强化学习的理论、自动驾驶技术的现状以及问题、深度强化学习在自动驾驶技术当中的应用及基于
    的头像 发表于 08-18 10:19 5153次阅读

    基于魔视智能先进的嵌入式深度学习技术的辅助自动驾驶产品正式量产落地

    深度学习有效的推动了人工智能技术飞跃,但是算法复杂性对于芯片算力的依赖始终困扰着整车产品工程。如何在低成本低功耗的硬件芯片局限下实现高度智能和实时的复杂神经网络,一直是困扰人工
    的头像 发表于 10-18 17:12 3487次阅读

    深度学习技术与自动驾驶设计的结合

    在过去的十年里,自动驾驶汽车技术取得了越来越快的进步,主要得益于深度学习和人工智能领域的进步。作者就自动驾驶中使用的
    发表于 10-28 16:07 2028次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>技术与自动<b class='flag-5'>驾驶</b>设计的结合

    深度学习:搜索和推荐中的深度匹配问题

    深度匹配问题,非常solid的综述,针对里面的一些方法,尤其是feature-based的深度学习方法增加了近期一些相关paper。推荐系统和搜索
    的头像 发表于 11-05 09:47 4110次阅读

    深度学习算法在自动驾驶规控中的应用解读

    虽然目前公开的自动驾驶规控算法相关资料大都是针对基于规则的算法的,但笔者打开招聘软件却经常能看到自动驾驶企业招聘规控算法工程师时会要求候选人懂深度
    的头像 发表于 11-16 09:57 1240次阅读

    深度学习在自动驾驶中的关键技术

    随着人工智能技术的飞速发展,自动驾驶技术作为其中的重要分支,正逐渐走向成熟。在自动驾驶系统中,深度学习技术发挥着至关重要的作用。它通过模拟人
    的头像 发表于 07-01 11:40 765次阅读