0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx助力计算平台满足CNN的嵌入式AI要求

e9Zb_gh_8734352 来源:未知 作者:胡薇 2018-10-22 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着智能安全、机器人无人驾驶汽车等应用越来越依靠嵌入式人工智能技术来提高性能,交付全新的用户体验,传统计算平台上的推断引擎很难在有限的功耗、时延和物理尺寸限制下满足实际要求。推断引擎必须满足严格定义的推断精度,还受限于总线宽度,而且存储器难以为最佳速度、效率和芯片面积进行调整优化。我们需要灵活应变的计算平台来满足运行一流卷积神经网络 (CNN) 的嵌入式 AI 的要求。

放眼未来,适应于更多前沿神经网络的灵活性是我们的主要关注点。今天广受欢迎的 CNN 正加速被新型的先进架构所取代。然而,传统的 SoC 设计要使用当前的神经网络架构知识,从开发开始到未来部署通常需要大约三年时间。RNN 或 Capsule Network 等新型神经网络可能会让传统 SoC 变得低效,也难以提供保持竞争力所需的性能。

嵌入式 AI 要满足最终用户期望,特别是要跟上可预见的未来不断提升的需求,就必须采用更加灵活的自适应计算平台。我们可利用用户可配置的多核片上系统 (MPSoC) 器件,整合主应用处理器和可扩展的可编程逻辑结构,包含可配置的存储器架构和满足可变精度推断所需的信号处理技术,从而满足上述要求。

推 断 精 度

在传统的 SoC 中,决定性能的特性如存储器架构和计算精确度等是固定的。最小值通常为 8 位,由核心 CPU 定义,不过就给定的算法而言最佳精度可能更低。MPSoC 支持可编程逻辑优化至晶体管层面,这就能根据需要让推断精度降低到 1 位。此外,这类器件还包含成千上万可配置的 DSP slice,能高效处理乘积累加 (MAC) 计算。

能自由优化推断精度,根据平方律提供刚好满足需求的计算效率,也就是说单位的运算用 1 位核心执行,相对于用 8 位核心完成相同计算而言,所需的逻辑仅为 1/64。此外,MPSoC 能让推断精度针对神经网络的每层做出不同优化,从而以最大的效率提供所需的性能。

存 储 器 架 构

除了通过改变推断精度来提高计算效率之外,配置可编程片上存储器的带宽和结构能进一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相对于运行相同推断引擎的传统计算平台而言,片上存储器可能达到 4 倍多,存储器—接口带宽可能达到 6 倍。存储器的可配置性使得用户能减少瓶颈,并优化芯片资源的利用率。此外,典型的子系统只有有限的片上集成高速缓存,必须与片外存储设备频繁交互,这就会增加时延和功耗。在 MPSoC 中,大多数存储器交换都在片上进行,这就会大幅提高速度,而且相对于片外存储器交互而言功耗降低超过 99%。

芯 片 面 积

解决方案的尺寸也越来越重要,特别就采用移动 AI 的无人机、机器人或无人/自动驾驶汽车而言尤其如此。MPSoC 的 FPGA 结构上实现的推断引擎可能仅占用传统 SoC 八分之一的芯片面积,这就能让开发人员在更小的器件中构建功能更强大的引擎。

此外,MPSoC 器件系列为设计人员提供了实现推断引擎的丰富选择,能支持最节能、成本效率最高、面积占用最小的方案,从而满足系统性能要求。一些通过汽车应用认证的部件具备硬件功能安全特性,达到业界标准的 ISO 26262 ASIL-C 安全规范,这对自动驾驶应用而言至关重要。比如赛灵思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和双核 ARM Cortex-R5 处理系统以及可扩展的可编程逻辑结构,这就能在单个芯片上整合控制处理、机器学习算法和安全电路,同时提供故障容错功能。

今天,嵌入式推断引擎可用单个 MPSoC 器件实现,功耗低至 2 瓦,这对移动机器人或自动驾驶汽车而言都是比较合适的功耗水平。传统计算平台即便现在也无法用这么低的功耗运行实时 CNN 应用,未来也不太可能在更严格的功耗限制条件下满足更快响应和更复杂功能的日益严格的要求。基于可编程 MPSoC 的平台能够提供更高的计算性能,更高的效率,也能在 15瓦以上的功率水平下减小面积和减轻重量。

如果开发人员不能在自己的项目中轻松地实现这些优势,那么这种可配置型多平行计算架构的优势就仅限于学术领域。成功需要适当的工具来帮助开发人员优化目标推断引擎的实现。为了满足有关需求,赛灵思不断扩展开发工具生态系统和机器学习软件堆栈,并与专业合作伙伴合作,一起简化和加速计算机视觉和视频监控等应用的实现。

面 向 未 来 的 灵 活 性

利用 SoC 的可配置性为手头应用创建最佳平台,也使得 AI 开发人员能够灵活地跟上神经网络架构快速发展演进的要求。业界可能迁移到新型神经网络的可能性,对于平台开发人员来说是一个巨大的风险。可重配置的 MPSoC 通过重配置并用当前最先进的策略来构建最高效的处理引擎,能够让开发人员灵活地响应神经网络架构方式的变化。

AI 越来越多地嵌入到各种设备中,包括工业控制、医疗设备、安全系统、机器人和自动驾驶汽车等。利用可编程逻辑结构的 MPSoC 器件的灵活应变加速技术,是提供保持竞争力所需的快速响应和高级功能的关键。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Xilinx
    +关注

    关注

    73

    文章

    2206

    浏览量

    131903
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266967

原文标题:Xilinx助力人工智能新型领域的应用

文章出处:【微信号:gh_873435264fd4,微信公众号:FPGA技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RZ/V2M:助力嵌入式设备的Vision AI高性能芯片

    RZ/V2M:助力嵌入式设备的Vision AI高性能芯片 在当今嵌入式设备飞速发展的时代,Vision AI技术的应用越来越广泛,对芯片的
    的头像 发表于 04-01 13:50 191次阅读

    一场为嵌入式与边缘AI从业者量身定制的技术盛宴,抢先预约席位!

    各位关注嵌入式与边缘计算的朋友们注意啦,「AI向实生态共融」嵌入式及边缘AI技术生态大会将于4月17日在深圳举办,绝对是你今年不容错过的行业
    的头像 发表于 04-01 07:59 123次阅读
    一场为<b class='flag-5'>嵌入式</b>与边缘<b class='flag-5'>AI</b>从业者量身定制的技术盛宴,抢先预约席位!

    嵌入式AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    入门开发者也能快速完成工业级 AI 应用开发,同时减少多平台切换带来的工具链维护成本。 在工业嵌入式领域,AI 的价值从来不是“能写代码”,而是“能写出安全可靠、可直接落地的代码”。P
    发表于 03-18 13:49

    2026年,嵌入式行业如何抢占AI红利?

    2026年,智能化转型进入深水区,从工业质检、智慧交通到消费电子、医疗设备,各类终端对AI算力、稳定性与场景适配性的要求持续升级,嵌入式AI板卡作为设备“智能核心”的作用愈发关键。飞凌
    的头像 发表于 01-23 08:02 1208次阅读
    2026年,<b class='flag-5'>嵌入式</b>行业如何抢占<b class='flag-5'>AI</b>红利?

    什么是嵌入式应用开发?

    系统中,用于控制、监测或通信等特定用途。与一般计算机系统不同,嵌入式系统通常具有较小的存储容量、处理能力和功耗,且需要满足特定的实时性、可靠性和安全性要求‌。 应用领域
    发表于 01-12 16:13

    arm嵌入式主板优缺点

    。   二、强大的扩展功能和网络传输功能:随着更多的行业开始使用到嵌入式主板,导致市场对主板功能的要求的差异化越来越大。嵌入式主板ARM的出现,恰恰满足了这个个性化的需求。从扩展性上
    发表于 01-08 07:08

    嵌入式软件单元测试中AI自动化与人工检查的协同机制研究:基于专业工具的实证分析

    分析、工具评估、实证研究与标准解读,得出以下结论: ‌嵌入式软件因安全关键性、实时性与硬件耦合性,对单元测试的要求远高于通用软件‌,必须使用专业工具如winAMS; ‌AI自动化测试显著提升效率与覆盖率
    发表于 12-31 11:22

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式AI 领域落地

    之后,要打造的是高可靠性、高能效还支持可扩展的 RISC-V 设计方案。而且合作的核心目标特别明确: 让 RISC-V 处理器在嵌入式、物联网、AI 系统里更快普及; 用集成 IP 和软件
    发表于 12-18 12:01

    嵌入式和FPGA的区别

    、光传输) 高性能计算(算法加速) 原型验证(ASIC前期验证) 军事航天(抗辐射、高可靠需求) 未来发展趋势 随着技术的融合,我们看到嵌入式处理器与FPGA结合的SoC器件(如Xilinx
    发表于 11-19 06:55

    嵌入式需要掌握哪些核心技能?

    )。 企业需求:招聘岗位中,C语言是100%必备技能,C++和汇编语言的需求随项目复杂度提升。 2)嵌入式硬件架构 主流平台:ARM Cortex-M/A系列、RISC-V内核,需掌握寄存器配置、时钟
    发表于 10-21 16:25

    飞凌嵌入式FCU3501嵌入式控制单元:工业级边缘AI计算的“硬核担当”

    边缘计算设备的性能与稳定提出了更加严苛的要求。飞凌嵌入式推出的FCU3501嵌入式控制单元,正是为这类场景量身打造的“工业级AI
    的头像 发表于 09-19 08:03 7538次阅读
    飞凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制单元:工业级边缘<b class='flag-5'>AI</b><b class='flag-5'>计算</b>的“硬核担当”

    新一代嵌入式开发平台 AMD嵌入式软件和工具2025.1版现已推出

    抢先体验 SHEL 流程简化所有 AMD 嵌入式开发平台上的软件项目生成过程 Zephyr RTOS 兼容性已扩展至第二代 AMD Versal AI Edge 系列、Kria SOM
    的头像 发表于 08-20 09:15 4219次阅读

    AMD嵌入式处理器为您的应用添能助力

    ,AMD 锐龙嵌入式处理器和 EPYC(霄龙)嵌入式处理器均能满足所需,凭借出色的耐用性、可靠性、能效及性能为要求严苛的应用添能助力
    的头像 发表于 07-07 14:09 2052次阅读

    飞凌嵌入式2025嵌入式及边缘AI技术论坛圆满结束

    飞凌嵌入式「2025嵌入式及边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和工程师用户,共享
    的头像 发表于 04-28 13:57 4346次阅读
    飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及边缘<b class='flag-5'>AI</b>技术论坛圆满结束

    飞凌嵌入式2025嵌入式及边缘AI技术论坛圆满结束

    4月22日下午,备受瞩目的飞凌嵌入式「2025嵌入式及边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和工程师用户,共享
    的头像 发表于 04-27 11:55 971次阅读
    飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及边缘<b class='flag-5'>AI</b>技术论坛圆满结束