0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习框架只为GPU? 答案在这里

模拟对话 2018-03-14 18:29 次阅读

目前大多数的机器学习是在处理器上完成的,大多数机器学习软件会针对GPU进行更多的优化,甚至有人认为学习加速必须在GPU上才能完成,但事实上无论是运行机器学习的处理器还是优化的深度学习框架,都不单只针对GPU,代号为“Skylake”的英特尔至强SP处理器就证明了这一点。

机器学习软件在英特尔至强SP系列白金版上的一系列基准测试性能表现与在GPU上非常相近,了解了底层架构之后,我们可以看到,在性能如此接近的情况下,使用GPU加速器更像是在购买一种“奢侈品”,用户在GPU以外还有很多其他的选择。毫无疑问,在用户只需要机器学习的情况下,“加速器”在性能和能耗方面更有优势,大多数人需要的不只是一台“智能的用于机器学习的服务器”,那就让我们来重点看一下英特尔至强SP 白金级处理器为什么是最佳的选择:

CPU优化深度学习框架和函数库

英特尔在基于GPU优化的框架中增加了CPU优化深度学习框架, 打破了深度学习框架偏重于GPU而忽视了CPU的行业现状,解决了目前这些框架缺乏CPU优化的实际问题。

- TensorFlow由谷歌开发,是一个领先的深度学习和机器学习框架,有面向Linux的处理器优化

- Caffe是图片识别领域最受欢迎的应用之一,英特尔提供的优化可以在CPU运行时提高Caffe的性能

- Torch是当下流行的深度学习框架,需要在优化的CPU上应用,可以通过英特尔软件优化(比如英特尔至强可扩展处理器)提高Torch在CPU上的性能

- Theano是一个开源的Python库,很受机器学习程序员的欢迎,它可以帮助程序员高效地定义、优化和评估涉及多维阵列的数学表达式

- Neon是一个基于Python的深度学习框架,目的是在现代深度神经网络上实现易用性和可扩展性,并致力于在所有硬件上实现性能的最大化

- MXNet是一个开源的深度学习框架

- Python及其函数库是机器学习应用里最受欢迎的基础组成,Python加速版过去几年里得到了广泛应用,并且可以直接下载或通过Conda、yum、apt-get或Docker images下载

- BigDL是一个面向Apache Spark的分布式深度学习函数库。通过BigDL用户可以把自己的深度学习应用当作标准Apache Spark程序来编写,直接在现有Apache Spark或Hadoop集群上运行。在Torch基础上开发的BigDL可以为深度学习提供综合性支持:包括数值计算(通过Tensor)和高级神经网络;此外用户还可以利用BigDL把提前训练的Caffe或Torch模型载入Spark程序。英特尔曾声称在一个单节点至强处理器上(例如与GPU相比),BigDL中的处理速度比原始开源Caffe、Torch或TensorFlow要高一个数量级

- 英特尔MKL-DNN是一个开源的、性能强化的函数库,用于加速在CPU上的深度学习框架

- 英特尔数据分析加速库(DAAL)是一个包含了被优化的算法构建模块的开源函数库,针对大数据问题最相关的数据分析阶段。这个函数库适用于当下流行的数据平台,包括Hadoop、Spark、R和Matlab

结果证明了一切,无论是TensorFlow、Caffe,还是Torch、Theano,这些深度学习框架都针对英特尔数学核心函数库(Intel MKL)和英特尔高级矢量扩展指令集(Intel AVX)进行了优化。通过CPU优化,TensorFlow和Caffe基准测试中的CPU性能分别提高了72倍和82倍。

机器学习加速器

科技与行业的发展都是瞬息万变的,机器学习的加速器也会从GPU转向FPGAASIC等等,除非我们永远只需要一台只能用于机器学习的服务器,只要在一台服务器上想实现可以支持各种的工作负载,英特尔至强可扩展处理器无疑是最佳的解决方案。加速器的选择正在变得多元化,这是整个行业的发展趋势,多核CPU(英特尔至强融核处理器,特别是“Knights Mill”版)和FPGA(英特尔至强处理器,包含Intel/Altera FPGA)都可以提供更灵活的选择、卓越的性价比和高能效。基于英特尔至强融核处理器训练或学习一个AlexNet图片分类系统的速度,是使用NVIDIA GPU的类似配置系统的2.3倍;英特尔至强融核处理器的性价比最高可以是GPU解决方案的9倍,每瓦性能高达8倍,英特尔Nervana将推出更多专为人工智能开发的产品。英特尔至强SP系列处理器为机器学习提供了卓越的性能,同时相比其他解决方案也为我们带来了更多的功能与选择,让我们在产品与行业的发展中都可以拥有更多可能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21736

    浏览量

    603319
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4739

    浏览量

    128941
  • 人工智能
    +关注

    关注

    1791

    文章

    47274

    浏览量

    238468
  • 机器学习
    +关注

    关注

    66

    文章

    8418

    浏览量

    132628
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121157
收藏 人收藏

    评论

    相关推荐

    深度学习工作负载中GPU与LPU的主要差异

    ,一个新的竞争力量——LPU(Language Processing Unit,语言处理单元)已悄然登场,LPU专注于解决自然语言处理(NLP)任务中的顺序性问题,是构建AI应用不可或缺的一环。 本文旨在探讨深度学习工作负载中GPU
    的头像 发表于 12-09 11:01 288次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>工作负载中<b class='flag-5'>GPU</b>与LPU的主要差异

    GPU深度学习中的应用 GPUs在图形设计中的作用

    随着人工智能技术的飞速发展,深度学习作为其核心部分,已经成为推动技术进步的重要力量。GPU(图形处理单元)在深度学习中扮演着至关重要的角色,
    的头像 发表于 11-19 10:55 504次阅读

    NPU在深度学习中的应用

    设计的硬件加速器,它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器,它与传统的CPU和GPU
    的头像 发表于 11-14 15:17 565次阅读

    PyTorch GPU 加速训练模型方法

    深度学习领域,GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作为一个流行的深度学习
    的头像 发表于 11-05 17:43 556次阅读

    GPU深度学习应用案例

    GPU深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是
    的头像 发表于 10-27 11:13 394次阅读

    深度学习GPU加速效果如何

    图形处理器(GPU)凭借其强大的并行计算能力,成为加速深度学习任务的理想选择。
    的头像 发表于 10-17 10:07 195次阅读

    FPGA做深度学习能走多远?

    。例如,在数据中心中,可以将 FPGA 与 CPU 或 GPU 结合使用,根据不同的任务需求进行灵活的资源分配和协同计算,提高整个系统的性能和效率。 • 算法优化和创新:随着深度学习算法的不断发展和优化
    发表于 09-27 20:53

    LM258在这个电路里是电压跟随器吗?R4在这里不影响输出电压吗?

    我想问一下LM258在这个电路里是电压跟随器吗?R4在这里不影响输出电压吗?根据虚短的原理,V-是等于Vref。 那么Vo和V-的关系怎么分析呢,是相等吗?怎么根据虚断的原理分析Vo和V-的关系?这里是怎么得到Vo=V-的呢?
    发表于 08-13 06:05

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 608次阅读

    基于Python的深度学习人脸识别方法

    基于Python的深度学习人脸识别方法是一个涉及多个技术领域的复杂话题,包括计算机视觉、深度学习、以及图像处理等。在这里,我将概述一个基本的
    的头像 发表于 07-14 11:52 1267次阅读

    深度学习常用的Python库

    深度学习常用的Python库,包括核心库、可视化工具、深度学习框架、自然语言处理库以及数据抓取库等,并详细分析它们的功能和优势。
    的头像 发表于 07-03 16:04 648次阅读

    TensorFlow与PyTorch深度学习框架的比较与选择

    深度学习作为人工智能领域的一个重要分支,在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中,深度
    的头像 发表于 07-02 14:04 972次阅读

    新手小白怎么学GPU云服务器跑深度学习?

    新手小白想用GPU云服务器跑深度学习应该怎么做? 用个人主机通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不动,如何实现更经济便捷的实现GPU云服务器
    发表于 06-11 17:09

    BACKUP_PRIMASK和RESTORE_PRIMASK在这里主要作用是什么?

    ); } 请问,BACKUP_PRIMASK和RESTORE_PRIMASK在这里主要作用是什么?像是对中断某些掩码的压栈出栈,具体在这里什么意思呢?感谢
    发表于 04-29 07:10

    FPGA在深度学习应用中或将取代GPU

    、笔记本电脑或机架式服务器上训练神经网络时,这不是什么大问题。但是,许多部署深度学习模型的环境对 GPU 并不友好,比如自动驾驶汽车、工厂、机器人和许多智慧城市环境,在这些环境中硬件必
    发表于 03-21 15:19