GPU深度学习面临的挑战分析-电子发烧友网

人工智能的兴起触发了市场对 GPU 的大量需求，但 GPU 在 AI 场景中的应用面临使用寿命短、使用成本高等问题。现场可编程门阵列（FPGA）这一可以定制化硬件处理器反倒是更好的解决方案。随着可编程性等问题在 FPGA 上的解决，FPGA 将成为市场人工智能应用的选择。

在过去的十年里，人工智能的再一次兴起使显卡行业受益匪浅。英伟达（Nvidia）和 AMD 等公司的股价也大幅上涨，因为事实表明，它们的 GPU 在训练和运行深度学习模型方面效果明显。实际上，英伟达也已经对自己的业务进行了转型，之前它是一家纯粹做 GPU 和游戏的公司，现在除了作为一家云 GPU 服务提供商外，英伟达还成立了专业的人工智能研究实验室。

不过，机器学习软件公司 Mipsology 的首席执行官兼联合创始人卢多维奇•拉祖尔（Ludovic Larzul）表示，GPU 还存在着一些缺陷，这使其在 AI 应用中面临着一些挑战。

Larzul 表示，想要解决这些问题的解决方案便是实现现场可编程门阵列（FPGA），这也是他们公司的研究领域。FPGA 是一种处理器，可以在制造后定制，这使得它比一般处理器更高效。但是，很难对 FPGA 进行编程，Larzul 希望通过自己公司开发的新平台解决这个问题。

专业的人工智能硬件已经成为了一个独立的产业，但对于什么是深度学习算法的最佳基础设施，人们仍然没有定论。如果 Mipsology 成功完成了研究实验，许多正受 GPU 折磨的 AI 开发者将从中受益。

GPU 深度学习面临的挑战

三维图形是 GPU 拥有如此大的内存和计算能力的根本原因，它与深度神经网络有一个共同之处：都需要进行大量矩阵运算。

显卡可以并行执行矩阵运算，极大地加快计算速度。图形处理器可以把训练神经网络的时间从几天、几周缩短到几小时、几分钟。

随着图形硬件公司供货的不断增加，GPU 在深度学习中的市场需求还催生了大量公共云服务，这些服务为深度学习项目提供强大的 GPU 虚拟机。

但是显卡也受硬件和环境的限制。Larzul 解释说：“神经网络训练通常是在一个确定的环境中进行的，运行神经网络的系统会在部署中遇到各种限制——这可能会对 GPU 的实际使用造成压力。”

GPU 需要大量的电力，会产生大量的热量，并需要使用风扇冷却。当你在台式工作站、笔记本电脑或机架式服务器上训练神经网络时，这不是什么大问题。但是，许多部署深度学习模型的环境对 GPU 并不友好，比如自动驾驶汽车、工厂、机器人和许多智慧城市环境，在这些环境中硬件必须忍受热、灰尘、湿度、运动和电力限制等环境因素。

Larzul 说：“在一些关键的应用场景中，比如智慧城市的视频监控，要求硬件暴露在对 GPU 有不利影响的环境因素（比如太阳）下。“ GPU 受晶体管技术的限制，导致它们在高温下运行时需要及时冷却，而这并不总是可以实现的。要做到这点需要更多的电力、维护成本等。”

使用寿命也是一个问题。一般来说，GPU 的使用寿命约为 2-5 年，这对那些每隔几年就换一次电脑的玩家来说不是什么大问题。但在其他领域，如汽车行业，需要硬件有更高的耐用性，这就带来了问题。特别是过多的暴露在恶劣的环境中，再加上高强度的使用，GPU 的使用寿命将会更短。

Larzul 说：“从商业可行性方面考虑，自动驾驶汽车等应用可能需要多达 7-10 个 GPU（其中大多数会在不到四年的时间内失效），对于大多数购车者来说，智能或自动驾驶汽车的成本将变得不切实际。”

机器人、医疗保健和安全系统等其他行业也面临着类似的挑战。

FPGA 和深度学习

FPGA 是可定制的硬件设备，可对其组件进行调节，因此可以针对特定类型的架构（如卷积神经网络）进行优化。其可定制性特征降低了对电力的需求，并在运算速度和吞吐量方面提供了更高的性能。它们的使用寿命也更长，大约是 GPU 的 2-5 倍，并且对恶劣环境和其它特殊环境因素有更强的适应性。

有一些公司已经在他们的人工智能产品中使用了 FPGA。微软就是其中一家，它将基于 FPGA 的机器学习技术作为其 Azure 云服务产品的一部分来提供。

不过 FPGA 的缺陷是难于编程。配置 FPGA 需要具备硬件描述语言（如 Verilog 或 VHDL）的知识和专业技能。机器学习程序是用 Python 或 C 等高级语言编写的，将其逻辑转换为 FPGA 指令非常困难。在 FPGA 上运行 TensorFlow、PyTorch、Caffe 和其他框架建模的神经网络通常需要消耗大量的人力时间和精力。

“要对 FPGA 进行编程，你需要组建一支懂得如何开发 FPGA 的硬件工程师团队，并聘请一位了解神经网络的优秀架构师，花费几年时间去开发一个硬件模型，最终编译运行在 FPGA 上，与此同时你还需要处理 FPGA 使用效率和使用频率的问题。“Larzul 说。此外你还需要具备广泛的数学技能，以较低的精度准确地计算模型，并需要一个软件团队将 AI 框架模型映射到硬件架构。

Larzul 的公司 Mipsology 希望通过 Zebra 来弥合这一差距。Zebra 是一种软件平台，开发者可以轻松地将深度学习代码移植到 FPGA 硬件上。

Larzul 说：“我们提供了一个软件抽象层，它隐藏了通常需要高级 FPGA 专业知识的复杂性。”“只需加载 Zebra，输入一个 Linux 命令，Zebra 就可以工作了——它不需要编译，不需要对神经网络进行任何更改，也不需要学习任何新工具。不过你可以保留你的 GPU 用于训练。”

AI 硬件前景

Mipsology 的 Zebra 平台是开发者探索在 AI 项目中使用 FPGA 的众多方案之一。Xilinx 是 FPGA 领域的领导者，已经开发了 Zebra 并将其集成到了电路板中。其他公司，如谷歌和特斯拉，也正积极的为其开发专用的 AI 硬件，用于自己的云产品和边缘计算产品环境中。

神经形态芯片方面也有着一些发展，这是一种专门为神经网络设计的计算机架构。英特尔在神经形态计算领域处于领先地位，已经开发了几种模型架构，不过该领域仍处于早期发展阶段。

还有专门用于特定应用的集成电路（ASIC），即专为某一特定人工智能需求制造的芯片。但 ASIC 缺乏 FPGA 的灵活性，无法重新编程。

Larzul 最后说，“我们决定专注于软件业务，探索研究提升神经网络性能和降低延迟的方案。Zebra 运行在 FPGA 上，因此无需更换硬件就可以支持 AI 推理。FPGA 固件的每次刷新都能给我们带来更高的性能提升，这得益于其高效性和较短的开发周期。另外，FPGA 的可选择方案很多，具有很好的市场适应性。”
责任编辑:tzh

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1631

文章
21808

浏览量
606807
gpu

gpu

+关注

关注
28

文章
4799

浏览量
129532
人工智能

人工智能

+关注

关注
1797

文章
47909

浏览量
240950

军事应用中深度学习的挑战与机遇

人工智能尤其是深度学习技术的最新进展，加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响了军事发展趋势，导致战争形式和模式发生重大变化。本文将概述

发表于 02-14 11:15 •144次阅读

深度学习工作负载中GPU与LPU的主要差异

，一个新的竞争力量——LPU（Language Processing Unit，语言处理单元）已悄然登场，LPU专注于解决自然语言处理（NLP）任务中的顺序性问题，是构建AI应用不可或缺的一环。本文旨在探讨深度学习工作负载中GPU

发表于 12-09 11:01 •2514次阅读

GPU在深度学习中的应用 GPUs在图形设计中的作用

随着人工智能技术的飞速发展，深度学习作为其核心部分，已经成为推动技术进步的重要力量。GPU（图形处理单元）在深度学习中扮演着至关重要的角色，

发表于 11-19 10:55 •813次阅读

深度学习中RNN的优势与挑战

循环神经网络（RNN）是深度学习领域中处理序列数据的基石。它们通过在每个时间步长上循环传递信息，使得网络能够捕捉时间序列数据中的长期依赖关系。然而，尽管RNN在某些任务上表现出色，它们也面临着一些

发表于 11-15 09:55 •675次阅读

NPU在深度学习中的应用

设计的硬件加速器，它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器，它与传统的CPU和GPU

发表于 11-14 15:17 •1035次阅读

pcie在深度学习中的应用

深度学习模型通常需要大量的数据和强大的计算能力来训练。传统的CPU计算资源有限，难以满足深度学习的需求。因此，GPU（图形处理单元）和TPU

发表于 11-13 10:39 •630次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是

发表于 10-27 11:13 •551次阅读

深度学习GPU加速效果如何

图形处理器（GPU）凭借其强大的并行计算能力，成为加速深度学习任务的理想选择。

发表于 10-17 10:07 •287次阅读

FPGA做深度学习能走多远？

的发展前景较为广阔，但也面临一些挑战。以下是一些关于 FPGA 在深度学习中应用前景的观点，仅供参考： • 优势方面： • 高度定制化的计算架构：FPGA 可以根据

发表于 09-27 20:53

深度学习算法在嵌入式平台上的部署

随着人工智能技术的飞速发展，深度学习算法在各个领域的应用日益广泛。然而，将深度学习算法部署到资源受限的嵌入式平台上，仍然是一个具有挑战性的任

发表于 07-15 10:03 •1830次阅读

基于深度学习的小目标检测

）的广泛应用，小目标检测的性能得到了显著提升。本文将详细探讨基于深度学习的小目标检测技术，包括其定义、挑战、常用方法以及未来发展方向。

发表于 07-04 17:25 •1115次阅读

深度学习与传统机器学习的对比

在人工智能的浪潮中，机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步，为众多领域带来了革命性的变化。然而，尽管它们都属于机器学习的范畴，但

发表于 07-01 11:40 •1587次阅读

新手小白怎么学GPU云服务器跑深度学习?

新手小白想用GPU云服务器跑深度学习应该怎么做? 用个人主机通常pytorch可以跑但是LexNet，AlexNet可能就直接就跑不动,如何实现更经济便捷的实现GPU云服务器

发表于 06-11 17:09

大模型时代，国产GPU面临哪些挑战

，国产GPU在不断成长的过程中也存在诸多挑战。在大模型训练上存在差距大语言模型是基于深度学习的技术。这些模型通过在海量文本数据上的训练，

发表于 04-03 01:08 •4806次阅读

FPGA在深度学习应用中或将取代GPU

基础设施，人们仍然没有定论。如果 Mipsology 成功完成了研究实验，许多正受 GPU 折磨的 AI 开发者将从中受益。 GPU 深度学习面临

发表于 03-21 15:19

搜索历史

GPU深度学习面临的挑战分析

评论

军事应用中深度学习的挑战与机遇

深度学习工作负载中GPU与LPU的主要差异

GPU在深度学习中的应用 GPUs在图形设计中的作用

深度学习中RNN的优势与挑战

NPU在深度学习中的应用

pcie在深度学习中的应用

GPU深度学习应用案例

深度学习GPU加速效果如何

FPGA做深度学习能走多远？

深度学习算法在嵌入式平台上的部署

基于深度学习的小目标检测

深度学习与传统机器学习的对比

新手小白怎么学GPU云服务器跑深度学习?

大模型时代，国产GPU面临哪些挑战

FPGA在深度学习应用中或将取代GPU