0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新一代深度神经网络推理装置xDNN的部分规格参数

DPVg_AI_era 来源:未知 作者:李倩 2018-08-31 09:00 次阅读

继年初发布新一代FPGA框架后,FPGA巨头赛灵思在Hot Chips大会揭露了最新一代深度神经网络推理装置xDNN的部分规格参数。随着更多定制芯片的发展,现如今AI芯片的战火已经蔓延到推理领域。赛灵思的xDNN可配置、可复写,进行多任务处理,还配有Tensor内存。

目前来看,FPGA可能没有像一些人预期的那样在深度学习的训练空间中占据一席之地,但AI推理的低功耗、高频率需求非常适合可重复编程硬件的性能曲线。

然而,现在人们越来越专注于推理与训练的新体系架构,FPGA也在努力在定制化硬件领域保持领先,而这要靠一些高级编程工具来降低编程的复杂度。

目前,要判断通用CPUGPU、FPGA及定制芯片如何才能吸引最广泛的用户群还为时尚早,但基于云的FPGA以及不断发展的高级FPGA集,越来越多地作为实验工具使用,让FPGA在面向推理的任务中占据了一席之地。

考虑到所有这些因素,FPGA制造商Xilinx近日在Hot Chips大会上发布了Xilinx深度神经网络推理(xDNN)设备的一些参数细节,公司将在接下来10月1日举行的开发者大会上发布更多信息和性能基准。

就在几年前,神经网络训练处理器还是架构展上的耀眼明星,但最近,GPU已经在与定制化、专门化的ASIC芯片和其他通用硬件展开激烈竞争,眼下战火又蔓延到了推理任务领域。

Xilinx的数据中心和IP总监Rahul Nimaiyar上周在Hot Chips大会上表示,用FPGA执行推理任务具备坚实的硬件基础。FPGA的数据处理并行的,并且支持数据重用、数据压缩,能够应对数据稀疏。

xDNN处理器的2D二维MAC阵列,灵活的高带宽片载存储器,支持多种方式访问,让数据的传输和转移更加高效。此外,xDNN还支持灵活的数据类型(FP32 / FP16及INT 16/8/4/2等)。

xDNN是一个可配置、可复写的处理器,可以映射到FPGA上而无需重新编程。Xilinx还提供了深度神经网络特定指令集(如卷积,最大池化等),可适用于任何网络和任何大小的图像,还可以编译和运行新网络。也就是说,xDNN可以与TensorFlow一起使用,无需重新编程或更改FPGA。

Virtex硬件可以用于几种类型的存储器;从位于DSP模块旁边的分布式基础RAM到UltraRAM,再到高带宽内存和外部DDR4内存都可以,从而实现计算效率的优化和性能提升。

上图是一个通道并行脉动阵列(channel parallel systolic arrays)的放大示意图,图中所示为分布式加权缓冲区。处理元件被加权映射到DSP块上,具体权重保存在处理旁边分布式RAM中,该RAM容量很小,速度很快。换句话说,这些分布式RAM就是权重缓存。

xDNN的“Tensor内存”位于脉动阵列的旁边,并存储输入和输出的特征映射。该部分也是并行通道,因此该阵列中的每个行都与一行内存相关联。也就是说,xDNN可以进行多任务处理,在阵列上进行计算,同时还可以根据需要引入新的网络层。

与其他面向推理任务的芯片一样,xDNN也在芯片内压缩了尽量多的内置存储器,以保持芯片的活性。这是一种比较艰难的平衡做法,目的是为了保证计算效率,从下面的基准测试结果来看,Xilinx的配置似乎是有效的。

除了硬件之外,提升易用性也是关键问题,无论是对于那些使用F1进行深度学习的人,还是用FPGA编程实现更精细的点的人来说,编译器和运行时间都是关键指标。

上图是关于Xilinx为用户开发的机器学习工具套件的更多信息,实际上,这是一个允许用户连接至框架的API,可以更容易地在Tensorflow中获得经过训练的模型和权重,例如,将其转换为一个Xilinx图,在它到达编译器之前通过一些优化,生成所有必要的指令集,以便在xDNN上运行该网络。

Xilinx还提供了一个量化器,可以将经过训练的权重数据输入到一些校准集中,以找到范围并快速获得这些权重的量化结果。

Nimaiyar表示,Xilinx已经抽取出了产生有效推理的其他元素,包括操作的融合(一旦访问被激活,这些操作直接作为流程运算符执行,而不再返回Tensor Memory),当特征映射大小超过片载存储器空间时,会进行指令级的并行化处理,和自动将映射在层内平铺,这意味着xDNN可以处理任何规模的特征映射。

上图的稀疏基准测试是Xilinx在其开发者论坛上发布的结果,到目前为止,60-80%的跨框架高效数据表现已经足够令人期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100752
  • AI芯片
    +关注

    关注

    17

    文章

    1886

    浏览量

    35012

原文标题:【AI芯展开推理战】赛灵思最新深度神经网络推理器xDNN参数曝光

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    卷积神经网络与传统神经网络的比较

    神经网络,也称为全连接神经网络(Fully Connected Neural Networks,FCNs),其特点是每层的每个神经元都与下
    的头像 发表于 11-15 14:53 404次阅读

    FPGA在深度神经网络中的应用

    随着人工智能技术的飞速发展,深度神经网络(Deep Neural Network, DNN)作为其核心算法之,在图像识别、语音识别、自然语言处理等领域取得了显著成果。然而,传统的深度
    的头像 发表于 07-24 10:42 674次阅读

    深度神经网络模型量化的基本方法

    深度神经网络模型量化是深度学习领域中的种重要优化技术,旨在通过减少模型参数的精度(即从高精度浮点数如32位浮点数FP32降低到低精度整数如
    的头像 发表于 07-15 11:26 675次阅读

    残差网络深度神经网络

    残差网络(Residual Network,通常简称为ResNet) 是深度神经网络种 ,其独特的结构设计在解决深层网络训练中的梯度消失
    的头像 发表于 07-11 18:13 1088次阅读

    简单认识深度神经网络

    深度神经网络(Deep Neural Networks, DNNs)作为机器学习领域中的种重要技术,特别是在深度学习领域,已经取得了显著的成就。它们通过模拟人类大脑的处理方式,利用多
    的头像 发表于 07-10 18:23 1023次阅读

    深度神经网络概述及其应用

    深度神经网络(Deep Neural Networks, DNNs)作为机器学习的种复杂形式,是广义人工神经网络(Artificial Neural Networks, ANNs)的
    的头像 发表于 07-04 16:08 1211次阅读

    循环神经网络和卷积神经网络的区别

    循环神经网络(Recurrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network,CNN)是深度学习领域中两种非常重要的神经网络
    的头像 发表于 07-04 14:24 1290次阅读

    深度神经网络与基本神经网络的区别

    在探讨深度神经网络(Deep Neural Networks, DNNs)与基本神经网络(通常指传统神经网络或前向神经网络)的区别时,我们需
    的头像 发表于 07-04 13:20 861次阅读

    深度神经网络的设计方法

    深度神经网络(Deep Neural Networks, DNNs)作为人工智能领域的重要技术之,通过模拟人脑神经元之间的连接,实现了对复杂数据的自主学习和智能判断。其设计方法不仅涉
    的头像 发表于 07-04 13:13 463次阅读

    bp神经网络深度神经网络

    BP神经网络(Backpropagation Neural Network)是种常见的前馈神经网络,它使用反向传播算法来训练网络。虽然BP神经网络
    的头像 发表于 07-03 10:14 843次阅读

    卷积神经网络和bp神经网络的区别

    化能力。随着深度学习技术的不断发展,神经网络已经成为人工智能领域的重要技术之。卷积神经网络和BP神经
    的头像 发表于 07-02 14:24 3863次阅读

    深度神经网络模型有哪些

    深度神经网络(Deep Neural Networks,DNNs)是类具有多个隐藏层的神经网络,它们在许多领域取得了显著的成功,如计算机视觉、自然语言处理、语音识别等。以下是
    的头像 发表于 07-02 10:00 1388次阅读

    神经网络架构有哪些

    神经网络架构是机器学习领域中的核心组成部分,它们模仿了生物神经网络的运作方式,通过复杂的网络结构实现信息的处理、存储和传递。随着深度学习技术
    的头像 发表于 07-01 14:16 708次阅读

    利用深度循环神经网络对心电图降噪

    具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI 我们提出了种利用由长短期记忆 (LSTM) 单元构建的深度循环神经网络来降 噪心电图信号 (ECG
    发表于 05-15 14:42

    详解深度学习、神经网络与卷积神经网络的应用

    在如今的网络时代,错综复杂的大数据和网络环境,让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年,深度学习逐渐走进人们的视线,通过
    的头像 发表于 01-11 10:51 2038次阅读
    详解<b class='flag-5'>深度</b>学习、<b class='flag-5'>神经网络</b>与卷积<b class='flag-5'>神经网络</b>的应用