0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

赛灵思推出了自适应计算加速平台Versal和加速器Alveo

Xilinx赛灵思官微 来源:djl 作者:赛灵思 2019-07-26 16:59 次阅读

1XDF(赛灵思开发者大会)在北京国际饭店举行。作为业界最权威、最具深度的FPGA交流大会之一,Xilinx把行业最顶尖的FPGA专家和企业汇聚一堂,集思广益,分享和交流FPGA产品开发经验与应用方案,为业内软硬件开发者与设计者提供独到的见解和灵感。Xilinx CEO Victor Peng 、华为IT智能计算业务副总裁张小华、阿里云FPGA异构计算研发总监张振祥等业内领袖出席。同时,在会上,赛灵思推出了业界首款自适应计算加速平台Versal和加速器Alveo,引爆现场。

作为Xilinx在中国智能汽车电子领域唯一的Certified member,深圳市自行科技有限公司(简称:自行科技)受邀参加,公司联合创始人兼CTO谌璟博士在现场分享了“基于FPGA的计算机视觉系统设计与开发”的主题演讲。谌璟博士结合其多年的深度学习与FPGA开发经验,从性能、成本、开发难度等多个维度出发,提出一套系统化的FPGA深度神经网络优化流程,受到了Xilinx AI及边缘计算产品营销总监Nick与机器学习产品营销高级经理Andy等业内专家的高度赞赏。

图文:自行科技联合创始人兼CTO谌璟博士做主题演讲

谌博认为,CNN与FPGA的结合可以组合利用多种算法模块,充分发挥FPGA在计算速度、功耗、成本等方面的优势,降低开发难度与周期,减少开发成本。但是CNN中存在大量冗余计算,因此如何在FPGA中实现CNN加速设计就尤为重要。

谌璟博士演讲获得现场嘉宾观众一致好评

自行科技通过多年CNN与FPGA自主研发经验,开发出业内最具性价比的FPGA加速设计方案。会中,她表示,FPGA加速设计需要算法工程师和FPGA工程师共同参与。一方面,通过剪枝压缩、权值压缩等方法对网络压缩算法进行优化,以减少网络冗余计算,释放可用资源。例如,我们可以仅仅将少数“重要”的卷积核量化为8bit权值,其余卷积核用1bit权值表示,构造混合精度网络,在确保网络检测性能的基础上大幅度提高计算效率。另一方面,不同的FPGA架构需要适配对应的CNN网络结构,因此需要有针对性地进行并行化和结构化设计,让计算模块得到充分利用,避免大量计算资源闲置。同时,在进行网络设计时还要充分利用FPGA片内资源,避免DSP计算资源与逻辑资源的浪费。

以SSD网络为例,在不考虑其他操作带来的时延(DDR时延、FSM状态转移时延~等)的情况下,Xilinx zynq7020在CNN计算帧率最高可达5.7fps;但是,自行科技通过权值压缩、并行化设计等CNN网络加速设计和算法优化后,计算帧率提升了4-5倍,大大提高了芯片的运行效率,成为了业内低成本高效率FPGA应用典范!

最后,谌博总结到:“FPGA与CNN的结合具备广泛的应用前景,但是在开发的过程中也需要我们不断克服困难和挑战。当前FPGA平台技术与工具不断迭代更新,这就需要我们时刻关注世界最前沿的技术。今天我非常高兴在现场见证了业界首款自适应计算加速平台Versal ACAP以及新一代FPGA加速器卡Alveo。这不仅可以加快公司软硬件迭代创新进程,还为我们探索更优秀的FPGA加速方案提供了思路。未来,随着CNN的计算量不断上升,数据吞吐量也会显著增大,这就需要不断提高FPGA片内BRAM资源利用效率,深入研究CNN模型压缩算法,优化基于FPGA的CNN框架,这也需要行业共同的努力!”

目前,该方案已经成功应用于公司的三大产品:前向ADAS系统、驾驶员监控(DMS)系统和智能环视影像系统,产品都已顺利实现量产。基于FPGA平台与CNN算法的深度结合,自行科技率先开发出国内首款基于深度学习技术的驾驶员监控(DMS)系统,打造出业内功能最全面、性价比最高的驾驶员监控(DMS)系统,成为国内驾驶员监控系统标杆企业。

除此之外,自行科技前向ADAS系统与智能环视影像系统以其可靠的目标检测准确性和语义分割精度获得国内众多传统车厂(乘用车与商用车)、新能源和互联网造车公司和Tier1汽车零部件供应商的高度认可。相信随着FPGA开发技术的不断成熟,CNN加速设计将获得更广泛的应用,让我们拭目以待!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 监控系统
    +关注

    关注

    21

    文章

    3904

    浏览量

    174338
  • 高效率
    +关注

    关注

    0

    文章

    31

    浏览量

    10439
  • 异构计算
    +关注

    关注

    2

    文章

    100

    浏览量

    16294
收藏 人收藏

    评论

    相关推荐

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    AMD Alveo V80计算加速器网络研讨会

    V80 计算加速卡由 AMD Versal HBM 自适应 SoC 提供支持,具有 Alveo 产品系列中最高的逻辑密度、内存带宽、网络吞
    的头像 发表于 11-08 09:35 178次阅读

    贸泽开售适用于高性能计算应用的AMD Alveo V80加速器

    、分子动力学、数据分析、网络安全、传感处理、计算存储和金融技术。   AMD Alveo V80加速器卡基于7nm Versal
    发表于 09-27 14:59 171次阅读

    ALINX受邀参加AMD自适应计算峰会

    近日,AMD 自适应计算峰会(AMD Adaptive Computing Summit, 即 AMD ACS)在深圳举行,聚焦 AMD 自适应 SoC 和 FPGA 产品最新动态,以及设计工具和开发环境的前沿技巧,是全球硬件开发者和工程师们深入交流与学习的优质
    的头像 发表于 08-02 14:36 609次阅读

    集成32GB HBM2e内存,AMD Alveo V80加速卡助力传感处理、存储压缩等

    电子发烧友网报道(文/黄晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自适应SoC搭配HBM,可处理
    的头像 发表于 06-05 16:16 2122次阅读
    集成32GB HBM2e内存,AMD <b class='flag-5'>Alveo</b> V80<b class='flag-5'>加速</b>卡助力传感<b class='flag-5'>器</b>处理、存储压缩等

    PMP22165.1-适用于 Xilinx 通用自适应计算加速平台 (ACAP) 的电源 PCB layout 设计

    电子发烧友网站提供《PMP22165.1-适用于 Xilinx 通用自适应计算加速平台 (ACAP) 的电源 PCB layout 设计.pdf》资料免费下载
    发表于 05-19 10:45 0次下载
    PMP22165.1-适用于 Xilinx 通用<b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b> (ACAP) 的电源 PCB layout 设计

    在Vivado中构建AMD Versal可扩展嵌入式平台示例设计流程

    为了应对无线波束形成、大规模计算和机器学习推断等新一代应用需求的非线性增长,AMD 开发了一项全新的创新处理技术 AI 引擎,片内集成该AI Engine的FPGA系列是Versal自适应计算
    的头像 发表于 04-09 15:14 1425次阅读
    在Vivado中构建AMD <b class='flag-5'>Versal</b>可扩展嵌入式<b class='flag-5'>平台</b>示例设计流程

    AMD Versal AI Edge自适应计算加速平台之PL通过NoC读写DDR4实验(4)

    Versal的DDR4是通过NoC访问,因此需要添加NoC IP进行配置。
    的头像 发表于 03-22 17:18 2261次阅读
    AMD <b class='flag-5'>Versal</b> AI Edge<b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b>之PL通过NoC读写DDR4实验(4)

    AMD Versal AI Edge自适应计算加速平台之PL LED实验(3)

    对于Versal来说PL(FPGA)开发是至关重要的,这也是Versal比其他ARM的有优势的地方,可以定制化很多ARM端的外设
    的头像 发表于 03-22 17:12 2364次阅读

    AMD Versal AI Edge自适应计算加速平台PL LED实验(3)

    对于Versal来说PL(FPGA)开发是至关重要的,这也是Versal比其他ARM的有优势的地方,可以定制化很多ARM端的外设
    的头像 发表于 03-13 15:38 964次阅读
    AMD <b class='flag-5'>Versal</b> AI Edge<b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b>PL LED实验(3)

    【ALINX 技术分享】AMD Versal AI Edge 自适应计算加速平台Versal 介绍(2)

    【ALINX 技术分享】AMD Versal AI Edge 自适应计算加速平台Versal 介绍,以及
    的头像 发表于 03-07 16:03 1023次阅读
    【ALINX 技术分享】AMD <b class='flag-5'>Versal</b> AI Edge <b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b>之 <b class='flag-5'>Versal</b> 介绍(2)

    【ALINX 技术分享】AMD Versal AI Edge 自适应计算加速平台之准备工作(1)

    AMD Versal AI Edge 自适应计算加速平台之准备工作,包含软件环境、硬件环境。
    的头像 发表于 03-07 15:49 790次阅读
    【ALINX 技术分享】AMD <b class='flag-5'>Versal</b> AI Edge <b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b>之准备工作(1)

    AMD Versal AI Edge自适应计算加速平台Versal介绍(2)

    Versal 包含了 Cortex-A72 处理和 Cortex-R5 处理,PL 端可编程逻辑部分,PMC 平台管理控制,AI En
    的头像 发表于 03-06 18:12 1451次阅读
    AMD <b class='flag-5'>Versal</b> AI Edge<b class='flag-5'>自适应计算</b><b class='flag-5'>加速</b><b class='flag-5'>平台</b>之<b class='flag-5'>Versal</b>介绍(2)

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是一种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场中的运动。本文将详细介绍回旋加速器的原理以及影响因素。 一、回旋
    的头像 发表于 01-30 10:02 3916次阅读

    Versal自适应SoC硬件、IP和平台开发方法指南

    电子发烧友网站提供《Versal自适应SoC硬件、IP和平台开发方法指南.pdf》资料免费下载
    发表于 01-03 10:49 0次下载
    <b class='flag-5'>Versal</b><b class='flag-5'>自适应</b>SoC硬件、IP和<b class='flag-5'>平台</b>开发方法指南