0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

灵活应变的计算平台满足嵌入式AI的要求

4dD0_chinacmos 来源:未知 作者:工程师曾玲 2018-10-02 09:45 次阅读

人工智能新兴应用通过带可配置加速的片上系统器件来满足日益严格的性能和效率需求

随着智能安全、机器人无人驾驶汽车等应用越来越依靠嵌入式人工智能技术来提高性能,交付全新的用户体验,传统计算平台上的推断引擎很难在有限的功耗、时延和物理尺寸限制下满足实际要求。推断引擎必须满足严格定义的推断精度,还受限于总线宽度,而且存储器难以为最佳速度、效率和芯片面积进行调整优化。我们需要灵活应变的计算平台来满足运行一流卷积神经网络 (CNN) 的嵌入式 AI 的要求。

放眼未来,适应于更多前沿神经网络的灵活性是我们的主要关注点。今天广受欢迎的 CNN 正加速被新型的先进架构所取代。然而,传统的 SoC 设计要使用当前的神经网络架构知识,从开发开始到未来部署通常需要大约三年时间。RNN 或 Capsule Network 等新型神经网络可能会让传统 SoC 变得低效,也难以提供保持竞争力所需的性能。

嵌入式 AI 要满足最终用户期望,特别是要跟上可预见的未来不断提升的需求,就必须采用更加灵活的自适应计算平台。我们可利用用户可配置的多核片上系统 (MPSoC) 器件,整合主应用处理器和可扩展的可编程逻辑结构,包含可配置的存储器架构和满足可变精度推断所需的信号处理技术,从而满足上述要求。

推断精度

在传统的 SoC 中,决定性能的特性如存储器架构和计算精确度等是固定的。最小值通常为 8 位,由核心 CPU 定义,不过就给定的算法而言最佳精度可能更低。MPSoC 支持可编程逻辑优化至晶体管层面,这就能根据需要让推断精度降低到 1 位。此外,这类器件还包含成千上万可配置的 DSP slice,能高效处理乘积累加 (MAC) 计算。

能自由优化推断精度,根据平方律提供刚好满足需求的计算效率,也就是说单位的运算用 1 位核心执行,相对于用 8 位核心完成相同计算而言,所需的逻辑仅为 1/64。此外,MPSoC 能让推断精度针对神经网络的每层做出不同优化,从而以最大的效率提供所需的性能。

存储器架构

除了通过改变推断精度来提高计算效率之外,配置可编程片上存储器的带宽和结构能进一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相对于运行相同推断引擎的传统计算平台而言,片上存储器可能达到 4 倍多,存储器—接口带宽可能达到 6 倍。存储器的可配置性使得用户能减少瓶颈,并优化芯片资源的利用率。此外,典型的子系统只有有限的片上集成高速缓存,必须与片外存储设备频繁交互,这就会增加时延和功耗。在 MPSoC 中,大多数存储器交换都在片上进行,这就会大幅提高速度,而且相对于片外存储器交互而言功耗降低超过 99%。

芯片面积

解决方案的尺寸也越来越重要,特别就采用移动 AI 的无人机、机器人或无人/自动驾驶汽车而言尤其如此。MPSoC 的 FPGA 结构上实现的推断引擎可能仅占用传统 SoC 八分之一的芯片面积,这就能让开发人员在更小的器件中构建功能更强大的引擎。

此外,MPSoC 器件系列为设计人员提供了实现推断引擎的丰富选择,能支持最节能、成本效率最高、面积占用最小的方案,从而满足系统性能要求。一些通过汽车应用认证的部件具备硬件功能安全特性,达到业界标准的 ISO 26262 ASIL-C 安全规范,这对自动驾驶应用而言至关重要。比如赛灵思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和双核 ARM Cortex-R5 处理系统以及可扩展的可编程逻辑结构,这就能在单个芯片上整合控制处理、机器学习算法和安全电路,同时提供故障容错功能。

今天,嵌入式推断引擎可用单个 MPSoC 器件实现,功耗低至 2 瓦,这对移动机器人或自动驾驶汽车而言都是比较合适的功耗水平。传统计算平台即便现在也无法用这么低的功耗运行实时 CNN 应用,未来也不太可能在更严格的功耗限制条件下满足更快响应和更复杂功能的日益严格的要求。基于可编程 MPSoC 的平台能够提供更高的计算性能,更高的效率,也能在 15瓦以上的功率水平下减小面积和减轻重量。

如果开发人员不能在自己的项目中轻松地实现这些优势,那么这种可配置型多平行计算架构的优势就仅限于学术领域。成功需要适当的工具来帮助开发人员优化目标推断引擎的实现。为了满足有关需求,赛灵思不断扩展开发工具生态系统和机器学习软件堆栈,并与专业合作伙伴合作,一起简化和加速计算机视觉和视频监控等应用的实现。

面向未来的灵活性

利用 SoC 的可配置性为手头应用创建最佳平台,也使得 AI 开发人员能够灵活地跟上神经网络架构快速发展演进的要求。业界可能迁移到新型神经网络的可能性,对于平台开发人员来说是一个巨大的风险。可重配置的 MPSoC 通过重配置并用当前最先进的策略来构建最高效的处理引擎,能够让开发人员灵活地响应神经网络架构方式的变化。

AI 越来越多地嵌入到各种设备中,包括工业控制、医疗设备、安全系统、机器人和自动驾驶汽车等。利用可编程逻辑结构的 MPSoC 器件的灵活应变加速技术,是提供保持竞争力所需的快速响应和高级功能的关键。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7484

    浏览量

    163767
  • soc
    soc
    +关注

    关注

    38

    文章

    4163

    浏览量

    218168
  • 人工智能
    +关注

    关注

    1791

    文章

    47198

    浏览量

    238268

原文标题:【展会】2018CIMF第三届生物识别、摄像头展震撼来袭(11月15—17日)

文章出处:【微信号:chinacmos,微信公众号:摄像头观察】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Xilinx隆重发布Vitis统一软件平台,赋予软件开发者灵活应变的硬件

    Vitis将赋予软件开发者灵活应变的硬件,同时将提高硬件设计者的工作效率。
    发表于 10-09 16:22 1149次阅读

    为什么需要嵌入式AI

    为什么需要嵌入式AI嵌入式AI还有瓶颈半导体厂商的新商机
    发表于 01-22 06:14

    如何满足嵌入式系统的灵活需求?

    嵌入式程序开发基本概念如何满足嵌入式系统的灵活需求开发高效程序的技巧是什么
    发表于 04-28 06:07

    工业嵌入式计算平台开发招聘

    西电移动计算与通信团队招聘:嵌入式软件开发(专职或兼职)研究方向:工业嵌入式计算平台开发。需求人数:1人
    发表于 10-12 09:32

    嵌入式AI平台有哪些?

    11.2.2 修剪神经网络 21.2.3 嵌入式终端优化 21.3 GPU 21.4 ARM 31.5 FPGA结构的并行计算 41.5.1 介绍 41.5.2 流水线计算 41.5.3 分布
    发表于 10-27 06:45

    嵌入式Linux的灵活

    嵌入式Linux的灵活性,为嵌入式计算而设计的高效、节能的处理器的可用性,以及新处理器的低成本,使许多工业公司在嵌入式处理器的基础上开发新的
    发表于 11-04 08:51

    嵌入式系统的三个基本的核心要素

    硬件平台、相关支撑硬件、嵌入式操作系统、支撑软件以及应用软件组成。其中,“嵌入性”、“专用性”与“计算机系统”是嵌入式系统的三个基本的核心要
    发表于 11-08 07:20

    嵌入式系统的三个基本的核心要素

    灵活性,主要由嵌入式硬件平台 、 相关支撑硬件 、 嵌入式操作系统 、 支撑软件以及应用软件组成。其中, “ 嵌入性 ”、“ 专用性 ”
    发表于 12-22 07:52

    汽车嵌入式计算平台的设计

    对汽车嵌入式计算平台的硬件和软件进行了分析
    发表于 07-02 15:04 22次下载

    Xilinx推出革命性的新型灵活应变计算产品

    Acceleration Platform,灵活应变计算加速平台)。ACAP 是一个高度集成的多核异构计算平台,能根据各种应用与工作负载的需求从硬件层对其进行
    发表于 03-20 03:42 1072次阅读

    灵活应变计算平台才能满足运行卷积神经网络的嵌入式 AI要求

    在传统的 SoC 中,决定性能的特性如存储器架构和计算精确度等是固定的。最小值通常为 8 位,由核心 CPU 定义,不过就给定的算法而言最佳精度可能更低。
    的头像 发表于 07-26 16:42 1363次阅读

    Xilinx Versal™ Premium专为灵活应变的云提供商而设计

    。Versal Premium 系列具备高度集成且功耗优化的网络硬核,是业界带宽最高、计算密度最高的自适应平台。Versal Premium 专为在散热条件和空间受限的环境下运行最高带宽网络,以及那些需要可扩展、灵活应变应用加速
    的头像 发表于 03-12 15:00 2319次阅读

    Versal Premium ACAP:在灵活应变平台上突破性集成功耗优化的网络IP

    电子发烧友网站提供《Versal Premium ACAP:在灵活应变平台上突破性集成功耗优化的网络IP.pdf》资料免费下载
    发表于 09-15 10:48 0次下载
    Versal Premium ACAP:在<b class='flag-5'>灵活应变</b>的<b class='flag-5'>平台</b>上突破性集成功耗优化的网络IP

    高端嵌入式实验平台

    一、整体概述 该嵌入式平台具有前沿性、专业性、高集成度、功能丰富等特点,平台涵盖嵌入式计算机技术、嵌入式硬件接口、
    的头像 发表于 01-29 09:55 514次阅读
    高端<b class='flag-5'>嵌入式</b>实验<b class='flag-5'>平台</b>

    AMD日前推出Ryzen(锐龙)嵌入式8000系列处理器

    AMD 日前推出 Ryzen(锐龙)嵌入式 8000 系列处理器,这是首款将基于 AMD XDNA 架构的 NPU 与传统 CPU 和 GPU 元件相结合的 AMD 嵌入式器件,面向工业人工智能( AI )应用对工作负载多功能性
    的头像 发表于 04-18 10:36 881次阅读