Flex Logix公司称它解决了深度学习的DRAM问题-电子发烧友网

深度学习有一个DRAM问题。设计用来实时处理复杂任务（比如，在汽车的备份摄像头视频流中分辨猫和孩子）的系统，不断地将构成神经网络内容的数据从存储器传送到处理器。

根据初创公司Flex Logix的说法，问题并不是缺乏存储这些数据的空间，而是处理器和存储器之间缺乏带宽。为了将数百千兆比特的数据提供给处理器，有些系统需要4个甚至8个DRAM芯片，这既使占用的空间增加了不少，又消耗了大量的电能。Flex Logix表示，它为可重构芯片开发的互连技术和tile-based架构将使AI系统只需要1个DRAM芯片的带宽，且功耗仅为十分之一。

图片来源：Flex Logix

NMAX512tile的架构。

位于加州山景城的Flex Logix公司已经开始将一种新的嵌入式现场可编程门阵列（eFPGA）架构商业化。但经过一番探索后，其创始人之一Cheng C. Wang意识到，这项技术可以加快神经网络的速度。

神经网络由连接和表示连接强度的“权重”组成。另一位创始人Geoff Tate解释说，一个好的AI芯片需要两样东西。一种是一些做关键“推断”计算（即乘法和累加）的电路。“但更困难的是，你必须非常擅长引入所有这些权重，以便其乘法器总能得到它们需要的数据，从而进行所需的数学运算。Wang意识到我们在FPGA的互连方面所拥有的技术，他可以对它做适应性改造，来创建一种非常擅长快速高效地加载权重、高性能和低功耗的架构。”

需要快速连续地将数百万个权重加载到网络中，这就是每秒要做数万亿次到数十万亿次运算的AI系统为什么需要那么多DRAM芯片的原因。DRAM芯片上的每个引脚每秒最多可以传输4Gb数据，因此要达到所需的每秒数百Gb的数据传输速度，就需要多个芯片。

在为FPGA开发最初的技术时，Wang注意到，这些芯片有约80%的面积互连，因此他寻求一种能够缩小互连面积并考虑到更多逻辑的架构。他和他在加州大学洛杉矶分校的同事对一种称为folded-Beneš网络的电信架构做了适应性改造来完成这项工作。这使得FPGA架构看起来像一堆逻辑和SRAM的瓦片(tile)。

图片来源：Flex Logix

Flex Logix公司表示，在芯片中构建分布式SRAM可加快计算速度并降低功耗。

Tate说，在这种专用互连方案中使用分布式SRAM最终会对深度学习的DRAM带宽问题产生重大影响。“我们正在用芯片上的SRAM取代DRAM带宽。”

图片来源：Flex Logix

若干NMAXtile可以置于一个芯片上并连在一起，以扩大计算能力。

用于Flex Logix的AI产品的tile称为NMAX，采用了台积电的16纳米技术，面积不到2平方毫米。每个tile都由一组核心组成，这些核心这些核心负责关键的乘法和累加计算、控制数据的处理和流动的可编程逻辑以及SRAM。这涉及三种不同类型的互连技术。一种tile上的所有零件连接在一起。另一种将tile与位于tile之间的附加SRAM及外部的DRAM相连接。第三种将相邻的tile连接在一起。

在深度学习领域，很难进行真正的横向比较。但Flex Logix的分析显示，将使用1个DRAM芯片的模拟的6×6tile的NMAX512阵列与使用8个DRAM的Nvidia Tesla T4进行比较，结果是新架构每秒能识别4,600张图像，而Nvidia每秒识别3,920张图像。在一项名为YOLOv3的实时视频处理测试中，同样大小的NMAX阵列可达到每秒22万亿次运算，而使用的DRAM带宽是其他系统的十分之一。

Tate表示，首批NMAX芯片的设计将于2019年下半年送至代工厂以便进行制造。

Flex Logix将波音公司视作其高吞吐量嵌入式FPGA产品的客户之一。但Tate承认，与神经网络相比，嵌入式FPGA是个很难卖的产品。“嵌入式FPGA是一项很好的业务，但是推理可能很快就会超越它。”Tate说。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

DRAM

DRAM

+关注

关注
40

文章
2320

浏览量
183636
神经网络

神经网络

+关注

关注
42

文章
4774

浏览量
100909
深度学习

深度学习

+关注

关注
73

文章
5507

浏览量
121298

原文标题：Flex Logix公司称它解决了深度学习的DRAM问题

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

ADI收购了一家eFPGA公司，可重构芯片成为FPGA发展新风向？

电子发烧友网报道（文/吴子鹏）日前，Flex Logix在其官网发文称，该公司已将其技术资产出售给一家大型上市公司，其技术资产和技术团队

发表于 11-12 01:22 •2231次阅读

ADI收购<b class='flag-5'>了</b>一家eFPGA<b class='flag-5'>公司</b>，可重构芯片成为FPGA发展新风向？

NPU在深度学习中的应用

随着人工智能技术的飞速发展，深度学习作为其核心驱动力之一，已经在众多领域展现出了巨大的潜力和价值。NPU（Neural Processing Unit，神经网络处理单元）是专门为深度学习

发表于 11-14 15:17 •695次阅读

ADI收购Flex Logix，强化数字产品组合

近日，全球领先的半导体公司ADI（Analog Devices, Inc.）宣布完成了对美国创新企业Flex Logix的收购。Flex Logix

发表于 11-12 14:17 •408次阅读

今日看点丨ADI收购eFPGA公司Flex Logix；业界首款！湖北发布高性能车规级芯片DF30

1. ADI 收购eFPGA 公司Flex Logix 设计可重构AI芯片的美国创企Flex Logix的官网显示，该

发表于 11-11 11:26 •605次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度学习

发表于 10-27 11:13 •417次阅读

激光雷达技术的基于深度学习的进步

信息。这使得激光雷达在自动驾驶、无人机、机器人等领域具有广泛的应用前景。二、深度学习技术的发展深度学习是机器学习的一个分支，

发表于 10-27 10:57 •434次阅读

AI大模型与深度学习的关系

人类的学习过程，实现对复杂数据的学习和识别。AI大模型则是指模型的参数数量巨大，需要庞大的计算资源来进行训练和推理。深度学习算法为AI大模型提供了

发表于 10-23 15:25 •936次阅读

深度学习中的时间序列分类方法

时间序列分类（Time Series Classification, TSC）是机器学习和深度学习领域的重要任务之一，广泛应用于人体活动识别、系统监测、金融预测、医疗诊断等多个领域。随着深度

发表于 07-09 15:54 •1038次阅读

深度学习与nlp的区别在哪

方法，它通过模拟人脑的神经网络结构，实现对数据的自动特征提取和学习。深度学习的核心是构建多层的神经网络结构，每一层都包含大量的神经元，这些神经元通过权重连接，实现对输入数据的逐层抽象和

发表于 07-05 09:47 •981次阅读

深度学习模型训练过程详解

深度学习模型训练是一个复杂且关键的过程，它涉及大量的数据、计算资源和精心设计的算法。训练一个深度学习模型，本质上是通过优化算法调整模型参数，

发表于 07-01 16:13 •1369次阅读

深度学习与传统机器学习的对比

在人工智能的浪潮中，机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步，为众多领域带来了革命性的变化。然而，尽管它们都属于机器学习的范畴，但

发表于 07-01 11:40 •1435次阅读

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度学习技术，使得

发表于 04-23 17:18 •1324次阅读

FPGA在深度学习应用中或将取代GPU

现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题在过去的十年里，人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司

发表于 03-21 15:19

为什么深度学习的效果更好？

导读深度学习是机器学习的一个子集，已成为人工智能领域的一项变革性技术，在从计算机视觉、自然语言处理到自动驾驶汽车等广泛的应用中取得了显著的成功。深度

发表于 03-09 08:26 •642次阅读

什么是深度学习？机器学习和深度学习的主要差异

2016年AlphaGo 击败韩国围棋冠军李世石，在媒体报道中，曾多次提及“深度学习”这个概念。

发表于 01-15 10:31 •1104次阅读

搜索历史

Flex Logix公司称它解决了深度学习的DRAM问题

评论

ADI收购了一家eFPGA公司，可重构芯片成为FPGA发展新风向？

NPU在深度学习中的应用

ADI收购Flex Logix，强化数字产品组合

今日看点丨ADI收购eFPGA公司Flex Logix；业界首款！湖北发布高性能车规级芯片DF30

GPU深度学习应用案例

激光雷达技术的基于深度学习的进步

AI大模型与深度学习的关系

深度学习中的时间序列分类方法

深度学习与nlp的区别在哪

深度学习模型训练过程详解

深度学习与传统机器学习的对比

深度解析深度学习下的语义SLAM

FPGA在深度学习应用中或将取代GPU

为什么深度学习的效果更好？

什么是深度学习？机器学习和深度学习的主要差异