深度学习框架只为GPU? 答案在这里-电子发烧友网

目前大多数的机器学习是在处理器上完成的，大多数机器学习软件会针对GPU进行更多的优化，甚至有人认为学习加速必须在GPU上才能完成，但事实上无论是运行机器学习的处理器还是优化的深度学习框架，都不单只针对GPU，代号为“Skylake”的英特尔至强SP处理器就证明了这一点。

机器学习软件在英特尔至强SP系列白金版上的一系列基准测试性能表现与在GPU上非常相近，了解了底层架构之后，我们可以看到，在性能如此接近的情况下，使用GPU加速器更像是在购买一种“奢侈品”，用户在GPU以外还有很多其他的选择。毫无疑问，在用户只需要机器学习的情况下，“加速器”在性能和能耗方面更有优势，大多数人需要的不只是一台“智能的用于机器学习的服务器”，那就让我们来重点看一下英特尔至强SP 白金级处理器为什么是最佳的选择：

CPU优化深度学习框架和函数库

英特尔在基于GPU优化的框架中增加了CPU优化深度学习框架，打破了深度学习框架偏重于GPU而忽视了CPU的行业现状，解决了目前这些框架缺乏CPU优化的实际问题。

- TensorFlow由谷歌开发，是一个领先的深度学习和机器学习框架，有面向Linux的处理器优化

- Caffe是图片识别领域最受欢迎的应用之一，英特尔提供的优化可以在CPU运行时提高Caffe的性能

- Torch是当下流行的深度学习框架，需要在优化的CPU上应用，可以通过英特尔软件优化（比如英特尔至强可扩展处理器）提高Torch在CPU上的性能

- Theano是一个开源的Python库，很受机器学习程序员的欢迎，它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式

- Neon是一个基于Python的深度学习框架，目的是在现代深度神经网络上实现易用性和可扩展性，并致力于在所有硬件上实现性能的最大化

- MXNet是一个开源的深度学习框架

- Python及其函数库是机器学习应用里最受欢迎的基础组成，Python加速版过去几年里得到了广泛应用，并且可以直接下载或通过Conda、yum、apt-get或Docker images下载

- BigDL是一个面向Apache Spark的分布式深度学习函数库。通过BigDL用户可以把自己的深度学习应用当作标准Apache Spark程序来编写，直接在现有Apache Spark或Hadoop集群上运行。在Torch基础上开发的BigDL可以为深度学习提供综合性支持：包括数值计算（通过Tensor）和高级神经网络；此外用户还可以利用BigDL把提前训练的Caffe或Torch模型载入Spark程序。英特尔曾声称在一个单节点至强处理器上（例如与GPU相比），BigDL中的处理速度比原始开源Caffe、Torch或TensorFlow要高一个数量级

- 英特尔MKL-DNN是一个开源的、性能强化的函数库，用于加速在CPU上的深度学习框架

- 英特尔数据分析加速库（DAAL）是一个包含了被优化的算法构建模块的开源函数库，针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台，包括Hadoop、Spark、R和Matlab

结果证明了一切，无论是TensorFlow、Caffe，还是Torch、Theano，这些深度学习框架都针对英特尔数学核心函数库（Intel MKL）和英特尔高级矢量扩展指令集（Intel AVX）进行了优化。通过CPU优化，TensorFlow和Caffe基准测试中的CPU性能分别提高了72倍和82倍。

机器学习加速器

科技与行业的发展都是瞬息万变的，机器学习的加速器也会从GPU转向FPGA、ASIC等等，除非我们永远只需要一台只能用于机器学习的服务器，只要在一台服务器上想实现可以支持各种的工作负载，英特尔至强可扩展处理器无疑是最佳的解决方案。加速器的选择正在变得多元化，这是整个行业的发展趋势，多核CPU（英特尔至强融核处理器，特别是“Knights Mill”版）和FPGA（英特尔至强处理器，包含Intel/Altera FPGA）都可以提供更灵活的选择、卓越的性价比和高能效。基于英特尔至强融核处理器训练或学习一个AlexNet图片分类系统的速度，是使用NVIDIA GPU的类似配置系统的2.3倍；英特尔至强融核处理器的性价比最高可以是GPU解决方案的9倍，每瓦性能高达8倍，英特尔Nervana将推出更多专为人工智能开发的产品。英特尔至强SP系列处理器为机器学习提供了卓越的性能，同时相比其他解决方案也为我们带来了更多的功能与选择，让我们在产品与行业的发展中都可以拥有更多可能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1630

文章
21803

浏览量
606490
gpu

gpu

+关注

关注
28

文章
4791

浏览量
129459
人工智能

人工智能

+关注

关注
1796

文章
47834

浏览量
240631
机器学习

机器学习

+关注

关注
66

文章
8452

浏览量
133139
深度学习

深度学习

+关注

关注
73

文章
5519

浏览量
121620

深度学习工作负载中GPU与LPU的主要差异

，一个新的竞争力量——LPU（Language Processing Unit，语言处理单元）已悄然登场，LPU专注于解决自然语言处理（NLP）任务中的顺序性问题，是构建AI应用不可或缺的一环。本文旨在探讨深度学习工作负载中GPU

发表于 12-09 11:01 •2197次阅读

GPU在深度学习中的应用 GPUs在图形设计中的作用

随着人工智能技术的飞速发展，深度学习作为其核心部分，已经成为推动技术进步的重要力量。GPU（图形处理单元）在深度学习中扮演着至关重要的角色，

发表于 11-19 10:55 •781次阅读

NPU在深度学习中的应用

设计的硬件加速器，它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器，它与传统的CPU和GPU

发表于 11-14 15:17 •973次阅读

PyTorch GPU 加速训练模型方法

在深度学习领域，GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作为一个流行的深度学习

发表于 11-05 17:43 •687次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是

发表于 10-27 11:13 •529次阅读

深度学习GPU加速效果如何

图形处理器（GPU）凭借其强大的并行计算能力，成为加速深度学习任务的理想选择。

发表于 10-17 10:07 •273次阅读

FPGA做深度学习能走多远？

。例如，在数据中心中，可以将 FPGA 与 CPU 或 GPU 结合使用，根据不同的任务需求进行灵活的资源分配和协同计算，提高整个系统的性能和效率。 • 算法优化和创新：随着深度学习算法的不断发展和优化

发表于 09-27 20:53

LM258在这个电路里是电压跟随器吗？R4在这里不影响输出电压吗？

我想问一下LM258在这个电路里是电压跟随器吗？R4在这里不影响输出电压吗？根据虚短的原理，V-是等于Vref。那么Vo和V-的关系怎么分析呢，是相等吗？怎么根据虚断的原理分析Vo和V-的关系？这里是怎么得到Vo=V-的呢？

发表于 08-13 06:05

NVIDIA推出全新深度学习框架fVDB

在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。

发表于 08-01 14:31 •698次阅读

基于Python的深度学习人脸识别方法

基于Python的深度学习人脸识别方法是一个涉及多个技术领域的复杂话题，包括计算机视觉、深度学习、以及图像处理等。在这里，我将概述一个基本的

发表于 07-14 11:52 •1327次阅读

深度学习常用的Python库

深度学习常用的Python库，包括核心库、可视化工具、深度学习框架、自然语言处理库以及数据抓取库等，并详细分析它们的功能和优势。

发表于 07-03 16:04 •740次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，深度

发表于 07-02 14:04 •1108次阅读

新手小白怎么学GPU云服务器跑深度学习?

新手小白想用GPU云服务器跑深度学习应该怎么做? 用个人主机通常pytorch可以跑但是LexNet，AlexNet可能就直接就跑不动,如何实现更经济便捷的实现GPU云服务器

发表于 06-11 17:09

BACKUP_PRIMASK和RESTORE_PRIMASK在这里主要作用是什么？

); } 请问，BACKUP_PRIMASK和RESTORE_PRIMASK在这里主要作用是什么？像是对中断某些掩码的压栈出栈，具体在这里什么意思呢?感谢

发表于 04-29 07:10

FPGA在深度学习应用中或将取代GPU

、笔记本电脑或机架式服务器上训练神经网络时，这不是什么大问题。但是，许多部署深度学习模型的环境对 GPU 并不友好，比如自动驾驶汽车、工厂、机器人和许多智慧城市环境，在这些环境中硬件必

发表于 03-21 15:19

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

深度学习框架只为GPU? 答案在这里

评论

深度学习工作负载中GPU与LPU的主要差异

GPU在深度学习中的应用 GPUs在图形设计中的作用

NPU在深度学习中的应用

PyTorch GPU 加速训练模型方法

GPU深度学习应用案例

深度学习GPU加速效果如何

FPGA做深度学习能走多远？

LM258在这个电路里是电压跟随器吗？R4在这里不影响输出电压吗？

NVIDIA推出全新深度学习框架fVDB

基于Python的深度学习人脸识别方法

深度学习常用的Python库

TensorFlow与PyTorch深度学习框架的比较与选择

新手小白怎么学GPU云服务器跑深度学习?

BACKUP_PRIMASK和RESTORE_PRIMASK在这里主要作用是什么？

FPGA在深度学习应用中或将取代GPU