深度学习方案ASIC、FPGA、GPU比较哪种更有潜力 - 全文

几乎所有深度学习的研究者都在使用GPU，但是对比深度学习硬鉴方案，ASIC、FPGA、GPU三种究竟哪款更被看好？主要是认清对深度学习硬件平台的要求。

今天被罗振宇的跨年演讲刷爆了朋友圈。不过他讲深度学习和GPU的时候，真让人虐心。

显卡的处理器称为图形处理器（GPU），它是显卡的“心脏”，与CPU类似，只不过GPU是专为执行复杂的数学和几何计算而设计的，这些计算是图形渲染所必需的。

对深度学习硬件平台的要求

要想明白“深度学习”需要怎样的硬件，必须了解深度学习的工作原理。首先在表层上，我们有一个巨大的数据集，并选定了一种深度学习模型。每个模型都有一些内部参数需要调整，以便学习数据。而这种参数调整实际上可以归结为优化问题，在调整这些参数时，就相当于在优化特定的约束条件。

深度学习方案ASIC、FPGA、GPU比较哪种更有潜力

百度的硅谷人工智能实验室（SVAIL）已经为深度学习硬件提出了DeepBench基准，这一基准着重衡量的是基本计算的硬件性能，而不是学习模型的表现。这种方法旨在找到使计算变慢或低效的瓶颈。因此，重点在于设计一个对于深层神经网络训练的基本操作执行效果最佳的架构。那么基本操作有哪些呢？现在的深度学习算法主要包括卷积神经网络（CNN）和循环神经网络（RNN）。基于这些算法，DeepBench提出以下四种基本运算：

矩阵相乘（Matrix Multiplication）——几乎所有的深度学习模型都包含这一运算，它的计算十分密集。

卷积（Convolution）——这是另一个常用的运算，占用了模型中大部分的每秒浮点运算（浮点/秒）。

循环层（Recurrent Layers ）——模型中的反馈层，并且基本上是前两个运算的组合。

All Reduce——这是一个在优化前对学习到的参数进行传递或解析的运算序列。在跨硬件分布的深度学习网络上执行同步优化时（如AlphaGo的例子），这一操作尤其有效。

除此之外，深度学习的硬件加速器需要具备数据级别和流程化的并行性、多线程和高内存带宽等特性。另外，由于数据的训练时间很长，所以硬件架构必须低功耗。因此，效能功耗比（Perf ormance per Watt）是硬件架构的评估标准之一。

深度学习方案ASIC、FPGA、GPU比较哪种更有潜力

GPU在处理图形的时候，从最初的设计就能够执行并行指令，从一个GPU核心收到一组多边形数据，到完成所有处理并输出图像可以做到完全独立。由于最初GPU就采用了大量的执行单元，这些执行单元可以轻松的加载并行处理，而不像CPU那样的单线程处理。另外，现代的GPU也可以在每个指令周期执行更多的单一指令。所以GPU比CPU更适合深度学习的大量矩阵、卷积运算的需求。深度学习的应用与其原先的应用需求颇为类似。GPU厂家顺理成章的在深度学习，找到了新增长点。

深度学习方案ASIC、FPGA、GPU比较哪种更有潜力

英伟达以其大规模的并行GPU和专用GPU编程框架CUDA主导着当前的深度学习市场。但是越来越多的公司开发出了用于深度学习的加速硬件，比如谷歌的张量处理单元（TPU/Tensor Processing Unit）、英特尔的Xeon Phi Knight‘s Landing，以及高通的神经网络处理器（NNU/Neural Network Processor）。

多亏了新技术和充满GPU的计算机数据中心，深度学习获得了巨大的可能应用领域。这家公司的任务中很大一部分都只是获取用来探索这些可能性的时间和计算资源。这项工作极大地扩张了设计空间。就科学研究而言，覆盖的领域已经在指数式扩张了。而这也已经突破了图像识别的范畴，进入到了语音识别、自然语言理解等其它任务中。正因为覆盖的领域越来越多，微软在提高其GPU集群的运算能力的同时也在探索使用其它的专用处理器，其中包括FPGA——一种能针对特定任务（如深度学习）编程的芯片。而且这项工作已经在全世界的技术和人工智能领域掀起了波澜。英特尔完成了其历史上最大的并购案，收购了专注FPGA的Altera。

FPGA的优势是，如果计算机需要改变，它可以被重新装配。但是，最通用、最主流的方案仍旧是使用 GPU，以并行处理大量数学运算。不出预料，GPU 方案的主要推动者是该市场的霸主英伟达。

英伟达旗舰显卡 Pascal Titan X

事实上， 2009 年之后人工神经网络的复兴与 GPU 有紧密联系——那一年，几名斯坦福的学者向世界展示，使用 GPU 可以在合理的时间内训练深度神经网络。这直接引发了 GPU 通用计算的浪潮。

英伟达首席科学家、斯坦福并发 VLSI 架构小组的负责人 William J. Dally 表示：“行内每个人现在都在做深度学习，这方面，GPU 几乎已经达到了最好。”

几乎所有深度学习的研究者都在使用GPU

熟悉深度学习的人都知道，深度学习是需要训练的，所谓的训练就是在成千上万个变量中寻找最佳值的计算。这需要通过不断的尝试实现收敛，而最终获得的数值并非是人工确定的数字，而是一种常态的公式。通过这种像素级的学习，不断总结规律，计算机就可以实现像像人一样思考。如今，几乎所有的深度学习（机器学习）研究者都在使用GPU进行相关的研究。当然，只是“几乎”。除了GPU之外，包括MIC和FPGA也提供了不同的解决方案。

“技术发展和科技的发展，是需要不同的技术一起来参与。无论是GPU也好、FPGA也好或者是专用的神经网芯片也好，它的主要目的都是推动深度学习（机器学习）这个方向的技术发展。那么我们在初期，确实可以尝试不同的技术，来探讨哪种技术可以更好的适合这项应用。从目前来看，深度学习大量的使用，主要集中在训练方面。那么在这个领域，GPU确实是非常适合的，这也体现在所有的这些工业界的大佬如BAT、谷歌，Facebook等等，都在使用GPU在做训练。”NVIDIA如是说。面对FPGA以及ASIC的挑战，NVIDIA表示“考虑是否设计低功耗的GPU，来满足用户的需求”。

除了硬件方面的因素之外，英伟达从软件方面解答了GPU对于深度学习应用的价值。首先从深度学习应用的开发工具角度，具备CUDA支持的GPU为用户学习Caffe、Theano等研究工具提供了很好的入门平台。其实GPU不仅仅是指专注于HPC领域的Tesla，包括Geforce在内的GPU都可以支持CUDA计算，这也为初学者提供了相对更低的应用门槛。除此之外，CUDA在算法和程序设计上相比其他应用更加容易，通过NVIDIA多年的推广也积累了广泛的用户群，开发难度更小。最后则是部署环节，GPU通过PCI-e接口可以直接部署在服务器中，方便而快速。得益于硬件支持与软件编程、设计方面的优势，GPU才成为了目前应用最广泛的平台。

深度学习发展遇到瓶颈了吗？

我们之所以使用GPU加速深度学习，是因为深度学习所要计算的数据量异常庞大，用传统的计算方式需要漫长的时间。但是，如果未来深度学习的数据量有所下降，或者说我们不能提供给深度学习研究所需要的足够数据量，是否就意味着深度学习也将进入“寒冬”呢？“做深度神经网络训练需要大量模型，然后才能实现数学上的收敛。深度学习要真正接近成人的智力，它所需要的神经网络规模非常庞大，它所需要的数据量，会比我们做语言识别、图像处理要多得多。假设说，我们发现我们没有办法提供这样的数据，很有可能出现寒冬”。

其实深度学习目前还在蓬勃发展往上的阶段。比如说我们现阶段主要做得比较成熟的语音、图像方面，整个的数据量还是在不断的增多的，网络规模也在不断的变复杂。

对于NVIDIA来说，深度学习是GPU计算发展的大好时机，其实这是一场各个能够实现深度学习各个芯片，以及巨头赛跑的结局。谁最先找到自己逼近深度学习最适合的芯片模式，谁就是胜利者。

GPU、FPGA 还是专用芯片？

尽管深度学习和人工智能在宣传上炙手可热，但无论从仿生的视角抑或统计学的角度，深度学习的工业应用都还是初阶，深度学习的理论基础也尚未建立和完善，在一些从业人员看来，依靠堆积计算力和数据集获得结果的方式显得过于暴力——要让机器更好地理解人的意图，就需要更多的数据和更强的计算平台，而且往往还是有监督学习——当然，现阶段我们还没有数据不足的忧虑。未来是否在理论完善之后不再依赖数据、不再依赖于给数据打标签（无监督学习）、不再需要向计算力要性能和精度？

退一步说，即便计算力仍是必需的引擎，那么是否一定就是基于GPU？我们知道，CPU和FPGA已经显示出深度学习负载上的能力，而IBM主导的SyNAPSE巨型神经网络芯片（类人脑芯片），在70毫瓦的功率上提供100万个“神经元”内核、2.56亿个“突触”内核以及4096个“神经突触”内核，甚至允许神经网络和机器学习负载超越了冯·诺依曼架构，二者的能耗和性能，都足以成为GPU潜在的挑战者。

不过，这些都尚未产品化的今天，NVIDIA并不担忧GPU会在深度学习领域失宠。首先，NVIDIA认为，GPU作为底层平台，起到的是加速的作用，帮助深度学习的研发人员更快地训练出更大的模型，不会受到深度学习模型实现方式的影响。其次，NVIDIA表示，用户可以根据需求选择不同的平台，但深度学习研发人员需要在算法、统计方面精益求精，都需要一个生态环境的支持，GPU已经构建了CUDA、cuDNN及DIGITS等工具，支持各种主流开源框架，提供友好的界面和可视化的方式，并得到了合作伙伴的支持，例如浪潮开发了一个支持多GPU的Caffe，曙光也研发了基于PCI总线的多GPU的技术，对熟悉串行程序设计的开发者更加友好。相比之下，FPGA可编程芯片或者是人工神经网络专属芯片对于植入服务器以及编程环境、编程能力要求更高，还缺乏通用的潜力，不适合普及。

深度学习方案ASIC、FPGA、GPU比较哪种更有潜力

目前来说，GPU贵，功耗高，运行效率比FPGA高，易使用。FPGA功耗，单颗性能是低的，单颗FPGA的硬件设计挑战没有GPU大，但是总体性价比和效率不占优;Intel收购Altera是否可以通过其工艺实力，给其带来极具的功能提升，我们还在长期的期待过程中。FPGA如果实现深度学习功能，还需要大批量使用，才能实现完整的功能，且需要与CPU相结合。

另外一个问题是，FPGA的大规模开发难度偏高，从业人员少。我们可以通过ARM战胜MIPS、以及STM32的迅速发展可以看到，一个好的生态环境，更多的从业人口，比技术、性价比本身更利于其发展。所以易用性是几个并行技术发展的一个重要考量维度。

FPGA犹如乐高，其灵活性，根据实际应用的需求，构建我所需要的硬件组件。但是乐高本身就是一种浪费：其功耗性能比，可变布线资源、多余的逻辑资源，其实都是浪费。所以你如果用乐高做一个机器人跟一个专门为格斗而开发的机器人对抗，结果可想而知。

FPGA在深度学习的应用场景，存在的价值在于其灵活性。DNN是深度神经网络系统的统称，实际使用的时候，使用几层网络，最终结果用什么样的筛选策略，在不同的应用和不同的设计框架下面，对硬件的诉求并不相同。

要看设计者的建模方案。GPU的一个缺点是，他的组件模块是乘法器、加法器。虽然深度学习的参数都是数学模型，需要对RTL级别的变化，但是GPU的硬件资源是以乘法器、加法器这样量级的硬件单元组成的。如果GPU的预先配置与使用者的模型相差甚远。例如：加法器配置15个，乘法器配置15个。但实际使用的时候，乘法器使用量是15个，但是加法器只需要2个。这就浪费了13个加法器的资源。而FPGA是以查找表和触发器子单元，组合成任意运算单元。

但是换种角度来看FPGA本身就是一种浪费。

当然ASIC是能效最高的，但目前，都在早期阶段，算法变化各异。想搞一款通用的ASIC适配多种场景，还是有很多路需要走的。但是，在通信领域，FPGA曾经也是风靡一时，但是随着ASIC的不断发展和蚕食，FPGA的份额和市场空间已经岌岌可危。如果深度学习能够迅速发展，有可能这个过程会比通信领域过程更短。

人机大战落幕后的两个月，谷歌硬件工程师 Norm Jouppi 才公开了其加速硬件的存在。在博客中，他解释道，谷歌给数据中心装备这些加速器卡已经有超过一年的时间。虽然谷歌对技术细节严格保密，但已透露它们专为谷歌开源项目 TensorFlow 而优化;它采取了：ASIC。

谷歌发布了人工智能芯片：Tensor Processing Unit，这是ASIC

据知情人士说，TPU已经在谷歌的数据中心运行了一年时间，由于谷歌严守TPU的秘密，所以TPU一直不为外界所知。这位知情人士说，从目前的运行效果来看，TPU每瓦能耗的学习效果和效率都比传统的CPU、GPU高出一个数量级，达到了摩尔定律预言的七年后的CPU的运行效果。这位知情人士不无煽情的说，请忘掉CPU、GPU、FPGA吧。

如此看来，在深度学习方面，TPU可以兼具桌面机与嵌入式设备的功能，也就是低能耗高速度。

据报道，TPU之所以具有良好的机器学习能力，是因为这种芯片具有比较宽的容错性，这就意味着，达到与通用芯片相同的学习效果，TPU不需要通用芯片那样多的晶体管，不需要通用芯片上那样多的程序操作步骤，也就是说，相同数量的晶体管，在TPU上能做更多的学习工作。

谷歌研发TPU并非要取代CPU或者FPGA，谷歌认为，TPU是介于CPU和ASIC （application-specific integrated circuit：应用集成电路）之间的芯片。ASIC用于专门的任务，比如去除噪声的电路，播放视频的电路，但是ASIC明显的短板是不可更改任务。通用CPU可以通过编程来适应各种任务，但是效率能耗比就不如ASIC。一如前边所言，在机器学习方面，TPU兼具了CPU与ASIC的特点，可编程，高效率，低能耗。

最后说说，异构处理器：

什么是异构多核处理器？简单地说异构多核处理器指的是在CPU里集成了 CPU与【其他模块】一起同步工作，【也就是说一块cpu 里不单有 CPU运算模块还有其他运算模块例如 GPU，FPGA，DSP等等。

AMD，Nvidia以及赛灵思公司都在进行异构多核处理器的研发

这是AMD的异构多核处理器

AMD在异构多核处理器发展方面是不遗余力，早在2012年就成立了“异构系统架构基金会”（HSA Foundation），首批会员是AMD、 ARM、Imagination Technologies、联发科和德州仪器（TI）是“异构系统架构基金会”的创始成员。

瞧瞧，英特尔的老对手ARM和AMD都在里面呢

HSA联盟发展了两年也有一些新成员加入，但是总的来说对英特尔威胁不大，直到，直到，赛灵思推了zynq的时候。

深度学习方案ASIC、FPGA、GPU比较哪种更有潜力

看看它的内部结构：

1、四核A53处理器 CPU

2、一个GPU Mali-400MP

3、一个Cortex-R5 CPU

4、电源管理单元，AMS单元

5、H.265（HEVC）视频编解码器

6、安全模块

7、UltraScale FPGA 单元;

这其实就是一款异构处理器，如前所述，它是一款ASIC就级的异构处理器！而且是64位，采用16nm FinFET工艺的处理器！而且是采用FPGA实现硬加速的处理器！但是这个ARM是不是偏弱了一点？做深度学习还是欠把火后。

Intel收购Altera，应该最终的目的也是要在异构处理器上面做出更多的文章吧。X86+FPGA，看起来好像很美。但是X86和FPGA结合就更符合模型么？目前也没有应用，更没有看到成熟的芯片推出。两个巨无霸的整合，可以说是用脚趾头都能想到很多的困难。Intel这口也许吃得太大了，吞得很痛苦。不是每个公司都有很强大执行力的，历史包袱在所难免。

阅读全文

上一页 1 2 3全文

本文导航

FPGA(591987) FPGA(591987)
英特尔(168289) 英特尔(168289)
asic(119149) asic(119149)
gpu(126255) gpu(126255)
深度学习(119797) 深度学习(119797)

ASIC和FPGA的优势与劣势

ASIC和FPGA具有不同的价值主张，在作出选择前必须仔细评估。两种种技术对比。这里介绍了ASIC和FPGA 的优势与劣势。

2011-03-31 17:30:09

5382

看FPGA如何击败GPU和GPP

本文从硬件加速的视角考察深度学习与FPGA，指出有哪些趋势和创新使得这些技术相互匹配，并激发对FPGA如何帮助深度学习领域发展的探讨。

2016-03-24 13:41:06

2482

相比GPU和GPP，FPGA是深度学习的未来？

相比GPU和GPP，FPGA在满足深度学习的硬件需求上提供了具有吸引力的替代方案。凭借流水线并行计算的能力和高效的能耗，FPGA将在一般的深度学习应用中展现GPU和GPP所没有的独特优势。同时，算法

2016-07-28 12:16:38

7350

FPGA在做深度学习加速时需要的技能

的主要有三种不同架构的器件种类：CPU，GPU，AI芯片/FPGA。CPU是一个通用架构芯片，其计算能力和数据带宽相对受到限制，面对大计算量的深度学习就显露出其缺点了。GPU含有大量的计算阵列，可以适用于大规模运算，而且其生态较为成熟和完整，所以现在包

2020-10-10 16:25:43

3349

自动驾驶主流架构方案对比：GPU、FPGA、ASIC

当前主流的AI芯片主要分为三类，GPU、FPGA、ASIC。GPU、FPGA均是前期较为成熟的芯片架构，属于通用型芯片。ASIC属于为AI特定场景定制的芯片。行业内已经确认CPU不适用于AI计算，但是在AI应用领域也是必不可少。

2023-02-14 11:03:56

2495

相比CPU、GPU、ASIC，FPGA有什么优势

CPU、GPU 都属于冯·诺依曼结构，指令译码执行、共享内存。FPGA 之所以比 CPU 甚至 GPU 能效高，本质上是无指令、无需共享内存的体系结构带来的福利。

2022-11-22 16:00:05

1256

ChatGPT炒热GPU，ASIC和FPGA能否分一杯羹？

算力有着不小需求的应用来说，ASIC和FPGA是否也能借上这股东风呢？不同硬件的成本对比在机器学习推理场景中，除了GPU外，还有一大通用AI硬件适合这一负载，那就是FPGA。与GPU一样，在技术和算法还未成熟且仍在打磨阶段时，可以随时重新编程改变芯片功能的

2023-02-22 09:23:29

5571

ASIC和FPGA有什么区别

　　1、概念区别：　　ASIC（专用集成电路）是一种在设计时就考虑了设计用途的IC。　　FPGA（现场可编程门阵列）也是一种IC。顾名思义，只要有合适的工具和适当的专业基础，工程师就可以对FPGA

2020-12-01 17:41:49

FPGA VS ASIC，究竟何时能取代后者？

跑得慢。因为 FPGA 内部是基于通用的结构，也就是 LUT（look up table），它可以实现加法器，组合逻辑等等，而 ASIC，一般加法器就是加法器，而比较器就是比较器，FPGA 结构上的通用性

2020-09-25 11:34:41

FPGA vs ASIC 你看好谁？

和设计，在FPGA上的速度应该比ASIC跑得慢。因为FPGA内部是基于通用的结构，也就是LUT（look up table），它可以实现加法器，组合逻辑等等，而ASIC，一般加法器就是加法器，而比较器

2017-09-02 22:24:53

FPGA 超越 GPU，问鼎下一代深度学习主引擎

的合著者之一，说：“深度学习是AI中最令人兴奋的领域，因为我们已经看到了深度学习带来的巨大进步和大量应用。虽然AI 和DNN 研究倾向于使用 GPU，但我们发现应用领域和英特尔下一代FPGA 架构之间

2017-04-27 14:10:12

FPGA与ASIC大PK，谁将引领移动端人工智能潮流？

），一旦设计制造完成后电路就固定了，无法再改变。　　　　用于深度学习加速器的FPGA（Xilinx Kintex 7 Ultrascle，左）和ASIC（Movidius Myriad 2，右）比较

2016-12-15 19:21:50

FPGA初学者用哪种开发板比较合适？？求推荐

FPGA初学者用哪种开发板比较合适？？求推荐

2015-04-01 19:57:03

FPGA和ASIC芯片解密有哪些性能分析

。厂商也可能会提供便宜的但是编辑能力差的FPGA。因为这些芯片有比较差的可编辑能力，所以这些设计的开发是在普通的FPGA上完成的，然后将设计转移到一个类似于ASIC的芯片上。 FPGA从设计的角度来说

2017-06-12 15:56:59

FPGA和深度学习有什么关系？

人工智能的风潮从技术一路蔓延到硬件，让“芯片”成为今年行业里盛极一时的主题。人们关注通用芯片领域里CPU和GPU不断刷新的基准（benchmark），更对专用芯片（ASIC）领域不同场景下不断问世的解决方案表示出了空前的热情。

2019-10-18 08:30:56

FPGA在深度学习应用中或将取代GPU

现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题在过去的十年里，人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅

2024-03-21 15:19:45

fpga应用观点碰撞总结，欢迎大家交流学习！

和ASIC是在一个水平线上的。相比FPGA而言，IC的优势是他内部走线更合理更有效，可以理解为IC就是一个人工精确优化后的FPGA设计。随着IC性能的发展，会有更多新的，要求更高的算法出来，同样

2015-01-06 17:22:57

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度学习存在哪些问题？

2021-10-14 08:20:47

深度学习推理和计算-通用AI核心

摘要与深度学习算法的进步超越硬件的进步，你如何确保算法明天是一个很好的适合现有的人工智能芯片下发展？，这些人工智能芯片大多是为今天的人工智能算法算法进化，这些人工智能芯片的许多设计都可能成为甚至在

2020-11-01 09:28:57

深度学习框架TensorFlow&TensorFlow-GPU详解

TensorFlow&TensorFlow-GPU：深度学习框架TensorFlow&TensorFlow-GPU的简介、安装、使用方法详细攻略

2018-12-25 17:21:10

深度学习框架只为GPU?

CPU优化深度学习框架和函数库机器学***器

2021-02-22 06:01:02

AI运算核心，FPGA领域前程远大

、GPU、FPGA及ASIC四种，依特性与使用目的不同又可区分为云端运算与边缘运算。前者云端运算因为需要处理庞大数据，加上长时间运作，芯片需求特性为功耗较高，整体效能佳，主要应用在数据中心与超级计算机

2017-12-05 08:09:38

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、这些主控异同点有哪些？

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、这些主控异同点有哪些？

2021-12-17 17:07:47

Mali GPU支持tensorflow或者caffe等深度学习模型吗

Mali GPU 支持tensorflow或者caffe等深度学习模型吗？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU运行？我希望把训练

2022-09-16 14:13:01

Nanopi深度学习之路(1)深度学习框架分析

，高度模块化，可扩展性）。 • 同时支持卷积神经网络和循环神经网络，以及两者的组合。• 在 CPU 和 GPU 上无缝运行。--摘自《Keras：基于-Python-的深度学习库》

2018-06-04 22:32:12

ai芯片和gpu的区别

ai芯片和gpu的区别▌车载芯片的发展趋势(CPU-GPU-FPGA-ASIC)过去汽车电子芯片以与传感器一一对应的电子控制单元(ECU)为主，主要分布与发动机等核心部件上。...

2021-07-27 07:29:46

cogoask讲解fpga和ASIC是什么意思

对其编程。以各种类型的FPGA芯片加上实验开发需要的外围通用电路，结合实验程序，就形成FPGA开发板，可以高效快速学习FPGA开发。ASIC(Application Specific

2012-02-27 17:46:03

　　华为云深度学习服务，让企业智能从此不求人

。由于深度学习需要使用海量数据来进行业务训练，因此计算资源需求很大，动则几十上百个GPU，甚至上千GPU等等；同时训练时间也很长，每次训练都是以天、周或甚至月年为单位。但是，开源的分布式训练框架，在保证

2018-08-02 20:44:09

【详解】FPGA：深度学习的未来？

（FPGA）提供了另一个值得探究的解决方案。日渐流行的FPGA设计工具使其对深度学习领域经常使用的上层软件兼容性更强，使得FPGA更容易为模型搭建和部署者所用。FPGA架构灵活，使得研究者能够在诸如GPU

2018-08-13 09:33:30

为什么说FPGA是机器深度学习的未来？

都出现了重大突破。深度学习是这些领域中所最常使用的技术，也被业界大为关注。然而，深度学习模型需要极为大量的数据和计算能力，只有更好的硬件加速条件，才能满足现有数据和模型规模继续扩大的需求。　　 FPGA

2019-10-10 06:45:41

主流深度学习框架比较

DL：主流深度学习框架多个方向PK比较

2018-12-26 11:10:18

人工智能实现的流派 FPGA vs. ASIC看好谁？

/2160275-16092G0433RY.jpg]　　用于深度学习加速器的 FPGA（Xilinx Kintex 7 Ultrascle，上）和 ASIC（Movidius Myriad 2，下

2016-12-23 16:52:40

什么是深度学习？

深度学习是什么意思

2020-11-11 06:58:03

什么是深度学习？使用FPGA进行深度学习的好处？

为深度学习计算而优化的 ASIC 被推向市场，GPU 配备了专门用于深度学习的电路。基于这些，不得不说用FPGA做深度学习的好处并不多。然而，与 DNN 权重降低相关的技术，如参数量化（或精度降低

2023-02-17 16:56:59

什么电源管理适用于FPGA、GPU和ASIC系统

在 FPGA、GPU 或 ASIC 控制的系统板上，仅有为数不多的几种电源管理相关的设计挑战，但是由于需要反复调试，所以这类挑战可能使系统的推出时间严重滞后。

2019-10-09 06:21:11

什么电源管理适用于FPGA、GPU和ASIC系统？

2019-09-30 06:59:24

从ASIC到FPGA的转换系统时钟设计方案

从ASIC到FPGA的转换系统时钟设计方案

2011-03-02 09:37:37

从FPGA到ASIC，异曲同工还是南辕北辙？

就以支持AWS的FPGA平台为主要方案。　　至此，FPGA AI这样一来设计迭代速度（尤其是配合了Chisel，HLS等敏捷开发流程之后）可以远远快于传统ASIC流程，同时硬件的能效比则远高于传统

2023-03-28 11:14:04

关于FPGA的学习和发展问题

AI方面不如GPU，专用领域又不如ASIC，边缘计算甚至都可以被ASIC替代，只有在一些特定的场景（验证）才能发挥作用。我不希望我在FPGA上付出的努力成为流水，所以想问问大家，FPGA的前景

2023-07-26 11:04:06

刚开始进行深度学习的同学怎么选择合适的机器配置

怎么为自己的深度学习机器选择合适的GPU配置呢？对于那些一直想进行深度学习研究的同学来说，一直是个比较纠结的问题，既要考虑到使用的场景，又要考虑到价格等各方面因素。如何选择深度学习的组件？这真的很

2018-09-19 13:56:36

到底什么是ASIC和FPGA？

。 ASIC用于设计规模大、复杂度高的芯片，或者是成熟度高、产量比较大的产品。 FPGA还特别适合初学者学习和参加比赛。现在很多大学的电子类专业，都在使用FPGA进行教学。从商业化的角度来看，FPGA

2024-01-23 19:08:55

可靠的液位检测方案有没有，大家做过哪种？

可靠的液位检测方案有没有，大家做过哪种？检测液位深度和液面位置。

2023-06-15 07:25:52

对FPGA与ASIC/GPU NN实现进行定性的比较

进的FPGA相对通用 GPU或NPU会更有效率。这使得以下应用FPGA比ASIC和GPU具有独特的优势：用于 ASIC开发的数字逻辑的原型设计和测试一些最新研究的算法通过FPGA搭建自研的数字集成电路并进

2023-02-08 15:26:46

射频系统的深度学习【回映分享】

本文由回映电子整理分享，欢迎工程老狮们参与学习与评论内容► 射频系统中的深度学习► Deepwave Digital技术► 信号检测和分类示例► GPU的实时DSP基准测试► 总结回映电子是一家

2022-01-05 10:00:58

带你宏观了解一下FPGA的市场，潜力？！

具有吸引力的替代方案。凭借流水线并行计算的能力和高效的能耗，FPGA将在一般的深度学习应用中展现GPU和GPP所没有的独特优势。未来，FPGA将有效地适应深度学习的发展趋势，从架构上确保相关应用和研究

2018-02-08 10:25:32

当AI遇上FPGA会产生怎样的反应

是人工智能大跃进的基础，在线下模型训练中Xeon-Phi、GPU等发挥着巨大的作用，而在线上的推理任务中，浪潮FPGA深度学习加速解决方案则能够实现7倍以上的能效比提升。卷积网络之父、Facebook

2021-09-17 17:08:32

适用于FPGA、GPU和ASIC系统的电源管理

电源产品供应商以及 FPGA、GPU 和 ASIC 制造商的验证，就可以防止很多电源和 DC/DC 调节问题。分析和解决问题的负担常常落在系统设计师的肩上。配置设计方案复杂的数字部分已经占据了这些

2018-10-15 10:30:31

适用于FPGA、GPU和ASIC系统的电源管理

电源产品供应商以及FPGA、GPU 和 ASIC 制造商的验证，就可以防止很多电源和 DC/DC调节问题。分析和解决问题的负担常常落在系统设计师的肩上。配置设计方案复杂的数字部分已经占据了这些设计师

2018-11-20 10:46:52

高密度IC设计中ASIC与FPGA选择谁

在过去10年间，全世界的设计人员都讨论过使用ASIC或者FPGA来实现数字电子设计的好处。通常这些讨论将完全定制IC的性能优势和低功耗与FPGA的灵活性和低NRE成本进行比较。设计队伍应当在ASIC

2019-07-15 07:00:39

ASIC设计转FPGA时的注意事项

FPGA原型验证和其他验证方法是不同的,任何一种其他验证方法都是ASIC验证中的一个环节,而FPGA验证却是一个过程。由于FPGA与ASIC在结构、性能上各不相同,ASIC是基于标准单元库,FPGA用的

2010-09-10 17:22:26

991

FPGA是深度学习的未来

FPGA是深度学习的未来，学习资料，感兴趣的可以看看。

2016-10-26 15:29:04

适用于 FPGA、GPU 和 ASIC 系统的电源管理

在 FPGA、GPU 或 ASIC 控制的系统板上，仅有为数不多的几种电源管理相关的设计挑战，但是由于需要反复调试，所以这类挑战可能使系统的推出时间严重滞后。不过，如果特定设计或类似设计已经得到电源

2016-11-04 15:57:06

611

ASIC和FPGA设计优势和流程比较

ASIC 和 FPGA 具有不同的价值主张，选择其中之一之前，一定要对其进行仔细评估。2种技术的比较信息非常丰富。这里介绍了ASIC和FPGA的优势与劣势。

2017-11-25 09:24:44

4375

FPGA、ASIC有望在机器学习领域中崛起

机器学习已经被广泛的的使用在了各个领域，在一年之内它的成长速度超过了预期。同时随着AI芯片的发展，在以后，FPGA和ASIC芯片将有望成为机器学习领域的新主力。

2017-12-26 10:46:07

1085

萨顿科普了强化学习、深度强化学习，并谈到了这项技术的潜力和发展方向

萨顿在专访中（再次）科普了强化学习、深度强化学习，并谈到了这项技术的潜力，以及接下来的发展方向：预测学习

2017-12-27 09:07:15

10857

GPU将失宠，ASIC 才是AI 前景所在

从上面的对比来看，能耗比方面：ASIC > FPGA > GPU > CPU，产生这样结果的根本原因：对于计算密集型算法，数据的搬移和运算效率越高的能耗比就越高。ASIC和FPGA都是更接近底层IO

2018-01-02 15:58:44

8875

FPGA、ASIC将在机器学习领域崛起

尽管GPU仍是当前的机器学习市场的主流，但有产业观察家已经预见了FPGA、ASIC在机器学习领域的崛起。Deloitte Global分析指出，FPGA与ASIC有助于降低机器学习应用的功耗，并提升系统的反应能力与灵活度，因此可望扩大机器学习的应用范围。

2018-01-06 10:01:07

4803

深度学习之GPU硬件选型

本文谈了谈gpu的一些重要的硬件组成，就深度学习而言，我觉得对内存的需求还是比较大的，core多也并不是能够全部用上，但现在开源的库实在完整，想做卷积运算有cudnn，想做卷积神经网络caffe

2018-01-06 12:01:09

3486

什么是ASIC芯片？与CPU、GPU、FPGA相比如何？

不过在联发科副总经理暨智能设备事业群总经理游人杰看来，虽然CPU、GPU等通用型芯片以及FPGA可以适应相对更多种的算法，但是特定算法下ASIC的性能和效能要更高。另外，虽然FPGA的便定制特性比ASIC芯片更加灵活，但部署FPGA所付出的成本也要比ASIC更高。

2018-05-04 15:39:03

251869

车载芯片的发展趋势(CPU-GPU-FPGA-ASIC)

着眼未来，自动驾驶也将逐步完善，届时又会加入激光雷达的点云(三维位置数据)数据以及更多的摄像头和雷达传感器，GPU也难以胜任，ASIC性能、能耗和大规模量产成本均显著优于GPU和FPGA，定制

2018-08-09 11:11:42

22663

一种递归神经网络在FPGA平台上的实现方案详解

近十年来，人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用，尽管拥有强大的模拟预测能力，深度学习还面临着超大计算量的问题。在硬件层面上，GPU，ASIC，FPGA都是解决庞大

2018-09-12 16:53:30

1992

半定制化的FPGA芯片和全定制化的ASIC芯片

目前以深度学习为代表的人工智能计算需求，主要采用 GPU、FPGA 等已有的适合并行计算的通用芯片来实现加速。在产业应用没有大规模兴起之时，使用这类已有的通用芯片可以避免专门研发定制芯片（ASIC

2018-12-03 11:14:36

6793

浅析GPU、FPGA、ASIC三种主流AI芯片的区别

当前主流的AI芯片主要分为三类，GPU、FPGA、ASIC。其中GPU、FPGA均是前期较为成熟的芯片架构，属于通用型芯片。ASIC属于为AI特定场景定制的芯片。

2019-03-07 14:39:21

29058

FPGA在深度学习领域的应用

本文从硬件加速的视角考察深度学习与FPGA，指出有哪些趋势和创新使得这些技术相互匹配，并激发对FPGA如何帮助深度学习领域发展的探讨。

2019-06-28 17:31:46

6529

关于FPGA和ASIC的区分和应用

ASIC芯片一旦流片功能就无法改变，基本专片专用。而FPGA可配置特性就可以应用在功能会改变的场合，例如，原型验证，ASIC设计过程中会使用到FPGA来进行原型验证；功能升级，在产品中采用FPGA实现一些业内暂时还没成熟的解决方案，可以在后续功能变动时方便升级。

2019-08-25 10:40:01

10935

AI的三种专用芯片 GPU和FPGA以及ASIC

人工智能的三大支撑是硬件、算法和数据，其中硬件指的是运行 AI 算法的芯片与相对应的计算平台。在硬件方面，目前主要是使用 GPU 并行计算神经网络，同时，还有 FPGA 和 ASIC 也具有未来异军突起的潜能。

2019-08-21 17:48:55

5236

GPU与CPU间的比较

GPU与CPU比较，GPU为什么更适合深度学习?

2019-08-26 15:32:00

4234

在未来GPU、FPGA、ASIC芯片将三分天下

在GPU编程方面，阿里云会推出分布式多机多卡训练框架和其他GPU上的性能优化服务，能够大大降低客户使用多机多卡的门槛，从而减少客户在云上做深度学习训练的时间。

2019-10-14 14:29:04

487

GPU和GPP相比谁才是深度学习的未来

相比GPU和GPP，FPGA在满足深度学习的硬件需求上提供了具有吸引力的替代方案。凭借流水线并行计算的能力和高效的能耗，FPGA将在一般的深度学习应用中展现GPU和GPP所没有的独特优势。

2019-10-18 15:48:14

1326

FPGA在深度学习领域的未来会有怎样的发展

近十年来，人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的作用，尽管拥有强大的模拟预测能力，深度学习还面临着超大计算量的问题。在硬件层面上，GPU，ASIC，FPGA都是解决庞大计算量的方案。

2019-10-22 15:26:21

977

FPGA有什么优势，可以让FPGA替代GPU吗

的深度学习训练模型领域，并且GPU创建了包含CNN、DNN、RNN、LSTM以及强化学习网络等算法在内的应用加速平台和生态系统。

2019-11-01 15:07:07

2657

FPGA对比 ASIC你看好谁？

FPGA vs. ASIC 你看好谁？

2020-01-15 16:10:22

4105

基于深度学习的ADAS系统，是GPU的主力市场

事实上，今天在汽车行业，GPU的用例几乎涵盖了从ADAS到自动驾驶，从仪表到中控信息娱乐等等多个车载系统。而在实际大规模量产落地领域，基于深度学习的ADAS系统，是GPU的主力市场。

2020-08-22 09:48:51

2003

GPU深度学习面临的挑战分析

人工智能的兴起触发了市场对 GPU 的大量需求，但 GPU 在 AI 场景中的应用面临使用寿命短、使用成本高等问题。现场可编程门阵列（FPGA）这一可以定制化硬件处理器反倒是更好的解决方案。随着可编程性等问题在 FPGA 上的解决，FPGA 将成为市场人工智能应用的选择。

2020-12-11 15:02:41

2494

使用Apache Spark和NVIDIA GPU加速深度学习

　　随着人们对深度学习（ deep learning ， DL ）兴趣的日益浓厚，越来越多的用户在生产环境中使用 DL 。由于 DL 需要强大的计算能力，开发人员正在利用 gpu 来完成他们的训练和推理工作。

2022-04-27 09:54:47

1873

FPGA中GPU深度学习面临的挑战

三维图形是 GPU 拥有如此大的内存和计算能力的根本原因，它与深度神经网络有一个共同之处：都需要进行大量矩阵运算。

2022-08-06 15:56:02

626

FPGA与CPU、GPU、ASIC的区别，FPGA在云计算中的应用方案

陌生，它一直都被广泛使用。但是，大部分人还不是太了解它，对它有很多疑问——FPGA到底是什么？为什么要使用它？相比 CPU、GPU、ASIC（专用芯片），FPGA有什么特点？…… 今天，带着这一系列的问题，我们一起来——揭秘FPGA。一、为什么使用 FPGA？众所周知，

2022-11-22 14:35:10

1087