0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

YCqV_FPGA_EETre 2018-01-09 08:45 次阅读

随着人工智能AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉语音识别以及自然语言处理等领域都取得了重大突破。CNN(Convolutional Neural Network,卷积神经网络)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的网络结构之一,尤其在图像处理领域取得了很大的成功。随着网络变得越来越大、越来越复杂,我们需要大量的计算资源来对其进行训练,因此人们纷纷将注意力转向FPGA(Field Programmable Gate Array,现场可编程门阵列)器件,FPGA不仅具有软件的可编程性和灵活性,同时又有ASIC高吞吐和低延迟的特性,而且由于具有丰富的I/O接口,FPGA还非常适合用作协议和接口转换的芯片

近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale,它能够利用实现训练好的CNN网络,比如行业标准的ResNet、AlexNet、Tiny Yolo和VGG-16等,并将它们进行压缩输出二进制描述文件,可以部署到Xilinx全系列可编程逻辑器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供数据给AIScale CNN加速器(PL),经过分类处理将输出数据给PS。压缩后的CNN网络占用资源相对小很多,可以部署在片上存储器中,可以更快更灵活的切换CNN网络。

KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale

图1:AIScale在计算机视觉应用案例示意图

AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core),用户根据需求可以灵活自定义AIScale RCC模块的数量,AIScale RCC支持卷积预处理、池化/采样、加权和全连接层等处理。资源更丰富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模块,这会给AIScale加速器带来更大的性能提升。当然也可以根据成本、系统功耗、性能需求集成一定的AIScale RCC模块,选择合适的Xilinx FPGA器件。

图2:多个 AIScale RCC模块级联连接

KORTIQ公司目前专注于嵌入式和计算机视觉领域,设计工业4.0和物联网IoT)等,未来将会为AIScale CNN加速器提供更多更先进的特性,比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等,将先进的人工智能网络应用到自动化生产、控制等场景中,提高相关行业的生产力为用户带来更好的服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1630

    文章

    21796

    浏览量

    605771
  • Xilinx
    +关注

    关注

    71

    文章

    2171

    浏览量

    122066
  • IP
    IP
    +关注

    关注

    5

    文章

    1716

    浏览量

    149916
  • cnn
    cnn
    +关注

    关注

    3

    文章

    353

    浏览量

    22317

原文标题:介绍一款基于FPGA的CNN硬件加速器IP

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    数据中心加速器就看GRVI Phalanx FPGA加速器

    数据中心采用FPGA加速器已经成为主流,像MS的Catapult,Amazon基于Xilinx FPGA的AWS F1,Intel的Altera,Baidu
    的头像 发表于 10-16 11:49 8938次阅读
    数据中心<b class='flag-5'>加速器</b>就看GRVI Phalanx <b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>

    机器学习实战:GNN加速器FPGA解决方案

    的场景。如上所述种种设计挑战的存在,使得业界急需种可以支持高度并发实时计算、巨大内存容量和带宽、以及在数据中心范围可扩展的GNN加速解决方案。5. GNN加速器FPGA设计方案Ac
    发表于 10-20 09:48

    一款低端14 MHz加速器Spitfire 500

    描述Spitfire 500,一款低端 14 MHz 加速器,带有 IDE 和用于 Amiga 500 的 4/8 MB 快速 RAM。代码https://github.com/jbilander/SF500
    发表于 07-05 06:01

    使用AMD-Xilinx FPGA设计个AI加速器通道

    介绍使用 AMD-Xilinx FPGA设计个全连接DNN核心现在比较容易(Vitis AI),但是利用这个核心在 DNN 计算中使用它是另回事。本项目主要是设计AI
    发表于 02-21 15:01

    高级语言(HLL)标准扩展大大简化基于FPGA加速器的应用程序的开发

    Virtex-7系列FPGA芯片。Convey公司是目前几个能够提供加速器板卡商业成品的提供商之加速器板卡也是这次
    发表于 02-08 12:34 439次阅读
    高级语言(HLL)标准扩展大大简化基于<b class='flag-5'>FPGA</b><b class='flag-5'>加速器</b>的应用程序的开发

    基于FPGA的通用CNN加速设计

    基于FPGA的通用CNN加速器整体框架如下,通过Caffe/Tensorflow/Mxnet等框架训练出来的CNN模型,通过编译
    发表于 10-27 14:09 1w次阅读
    基于<b class='flag-5'>FPGA</b>的通用<b class='flag-5'>CNN</b><b class='flag-5'>加速</b>设计

    优化基于FPGA的深度卷积神经网络的加速器设计

    CNN已经广泛用于图像识别,因为它能模仿生物视觉神经的行为获得很高识别准确率。最近,基于深度学习算法的现代应用高速增长进步改善了研究和实现。特别地,多种基于FPGA平台的深度CNN
    发表于 11-17 13:31 8113次阅读

    基于Xilinx 28nmFPGA的Dragen加速器板卡用于基因组分析算法的加速的解析

    方案可能就不能够满足需求了,此外开发个ASIC处理也需要较长的时间周期。因此Edico Genome公司将注意力转移到FPGA上,FPGA
    的头像 发表于 12-31 23:14 5495次阅读

    一款Xilinx FPGACNN加速器IPAIScale

    随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。CNN(Convolutional Neural
    发表于 07-10 10:49 4794次阅读

    基于Xilinx FPGA的Memcached硬件加速器的介绍

    本教程讨论基于Xilinx FPGA的Memcached硬件加速器的技术细节,该硬件加速器可为10G以太网端口提供线速Memcached服务。
    的头像 发表于 11-27 06:41 3767次阅读

    Kortiq小巧高效的CNN加速器,支持所有类型

    Kortiq提供易于使用,可扩展且小巧的CNN加速器。 该设备支持所有类型的CNN,并动态加速网络中的不同层类型。
    的头像 发表于 11-23 06:28 3198次阅读

    Achronix和BittWare推出采用FPGA芯片的加速

    近日,基于现场可编程门阵列(FPGA)的数据加速器件和高性能嵌入式FPGA(eFPGA)半导体知识产权(IP)领导性企业Achronix半导
    发表于 10-31 15:11 889次阅读

    电子学报第七期《种可配置的CNN加速器FPGA实现方法》

    电子学报第七期《种可配置的CNN加速器FPGA实现方法》
    发表于 11-18 16:31 15次下载

    如何采用带专用CNN加速器的AI微控制实现CNN的硬件转换

    本文重点解释如何使用硬件转换卷积神经网络(CNN),并特别介绍使用带CNN硬件加速器的人工智能(AI)微控制在物联网(IoT)边缘实现人工智能应用所带来的好处。 AI应用通常需要消耗
    的头像 发表于 05-16 01:05 865次阅读

    基于FPGA的深度学习CNN加速器设计方案

    因为CNN的特有计算模式,通用处理对于CNN实现效率并不高,不能满足性能要求。 因此,近来已经提出了基于FPGA,GPU甚至ASIC设计的
    发表于 06-14 16:03 2382次阅读
    基于<b class='flag-5'>FPGA</b>的深度学习<b class='flag-5'>CNN</b><b class='flag-5'>加速器</b>设计方案