0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习如何满足DNN推理的要求

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-09-14 09:55 次阅读

电子发烧友网报道(文/周凯扬)10年前谷歌作为互联网巨头,就已经嗅到了机器学习的潜力,尤其是在深度神经网络(DNN)模型上。就拿语音识别这样的功能来说,如果要考虑到1亿安卓用户每天和手机对话三分钟这样的高并发情况,单单只靠CPU的话,他们需要将现有数据中心的规模扩大至两倍,才能满足DNN推理的要求。

但扩建数据中心是一个投入极高的工作,于是他们考虑用定制的特定域架构的硬件来减少完成推理任务的总拥有成本,而且又要能运行已经为CPU和GPU开发的应用。谷歌在2014年开启了TPUv1的项目,15个月后,全新的TPU硬件就已经应用到了谷歌的数据中心里,连带架构、编译器、测试和部署都全部更新了一遍。

那时GPU在推理这块的性能也还是超过CPU的,但TPU的出现改变了这个格局。与当时英特尔的Haswell CPU相比,TPUv1的能耗比有了80倍的提升,相较当时的英伟达Tesla K80 GPU,其能耗比也高达它的30倍。

8da5c3c4-33b8-11ed-ba43-dac502259ad0.png

每代TPU的性能指标 / 谷歌

谷歌此举引爆了整个市场,大家发现了还有除了CPU、GPU之外的方案。英特尔察觉后也收购了一系列深度学习DSA芯片公司,比如Nervana、Movidius、Mobileye和Habana。谷歌在云服务上的竞争对手们,阿里巴巴和亚马逊也开始打造自己的推理、训练芯片。能耗比之战下,大家很快也意识到机器学习带来的碳足迹成了下一个急需解决的问题。

碳足迹的反噬

根据去年在IEEE Spectrum上发布的《深度学习受益递减》一文中提到,随着机器学习的发展,到了2025年,最强的深度学习系统在ImageNet数据集中进行物体识别时,错误率最高只有5%。但训练这样一个系统所需要的算力和能耗都是庞大的,更糟糕的是,其排放的二氧化碳将是纽约市一整个月的排放量。

机器学习的碳排放可以被分为两种,一种是运营排放,也就是数据中心在运行机器学习硬件中产生的碳排放;第二种是整个生命周期内的排放,不仅包含运营排放,还包含了各个环节的碳排放,比如芯片制造、数据中心建造等等。考虑到后者涉及更加复杂的研究,所以大部分碳足迹的研究都集中在运营排放上。

至于如何记录碳排放,这也很简单,只需要将训练/推理的时长x处理器数量x每个处理器的平均功耗x PUE x 每千瓦时的二氧化碳排放即可。除了最后一项参数需要从数据中心那获取外,其他的数据基本都是公开,或取决于机器学习研究者自己的选择。

如何减少机器学习的碳足迹图灵奖得主、谷歌杰出工程师David Patterson教授对现有的机器学习的研究和工作提出了以下几点建议。首先,从模型开始着手,机器学习研究者需要继续开发效率更高的模型,比如谷歌去年发布的GLaM通用稀疏语言模型,相较GPT-3,它多出了7倍的参数,在自然语言推理等任务上都要优于GPT-3。但同样重要的是它的能耗和碳足迹指标,根据谷歌公布的数据,与使用V100的GPT-3相比,使用TPUv4的GLaM二氧化碳排放减少了14倍,可见模型对于碳足迹的影响。其次,在发布新模型的时候,他建议也把能耗和碳足迹这样的数据公开,这样有助于促进机器学习模型在质量上的良性竞争。

接着是硬件,他指出我们需要像TPUv4或者A100 GPU等,这类机器学习能效比更高的硬件。其实这一点反倒是最不需要担心的,这几乎是每个初创AI芯片公司都在尝试的做法,即便在峰值上不敌这些硬件,也绝对会在能效比上尽可能做大极致。

8de675fe-33b8-11ed-ba43-dac502259ad0.png

全球大规模数据中心的平均PUE / Uptime Institute

还有就是常见的能效衡量指标PUE,大型机器学习负载往往要在数据中心上运行,而要让数据中心的PUE接近1并不是一件简单的事。根据Uptime Institute的统计,各家厂商旗下最大数据中心的年度PUE为1.57,就连我国工信部印发的《新型数据中心发展三年行动计划(2021-2023)》中提出的最终目标也只是将新建大型数据中心PUE降低至1.3以下。但好在新建的数据中心往往都不会只满足于这个目标,而是往1.1乃至1.06这样的指标推进。

可这个指标并不是一个死数据,随着负载和用量的变动,PUE是在持续波动的,不少数据中心仅仅在建成时发布了能效指标,之后就再未公布过任何数据了。在这块做得最好的也还是谷歌,谷歌每年都会发布年度能效报告,将各个数据中心每个季度的PUE公布出来。

不过仅仅只有极低的PUE只能体现出高能耗比,David Patterson教授认为还必须一并公布每个地区数据中心的清洁能源占比。比如阿里巴巴首次发布的《2022阿里巴巴环境、社会和治理报告》中就提到了2021年,阿里巴巴在中国企业可再生能源购买者中排名第一,2022财年阿里云21.6%的电力来自清洁能源。

在双碳目标的提出下,我国其实已经落实到了机器学习的硬件上,但在软件和碳足迹透明度这方面还有可以改善的空间。机器学习要想做到消耗更低的算力来实现更优的效果,就必须从各个环节做到节能减排。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10544

    浏览量

    207646
  • 神经网络
    +关注

    关注

    42

    文章

    4607

    浏览量

    99465
  • 机器学习
    +关注

    关注

    66

    文章

    8192

    浏览量

    131242

原文标题:机器学习的双碳目标

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    。 我发现IMAGIMOB 是一个很好的解决方案来满足我的需求,但现在的问题是, PSoC™ Creator 不支持 IMAGIMOB! PSoC™ Creator 可以支持机器学习或 IMAGIMOB 吗?
    发表于 05-20 08:06

    基于OpenCV DNN实现YOLOv8的模型部署与推理演示

    基于OpenCV DNN实现YOLOv8推理的好处就是一套代码就可以部署在Windows10系统、乌班图系统、Jetson的Jetpack系统
    的头像 发表于 03-01 15:52 731次阅读
    基于OpenCV <b class='flag-5'>DNN</b>实现YOLOv8的模型部署与<b class='flag-5'>推理</b>演示

    FPGA在新兴DNN推理领域的应用

    电子发烧友网站提供《FPGA在新兴DNN推理领域的应用.pdf》资料免费下载
    发表于 09-15 10:52 0次下载
    FPGA在新兴<b class='flag-5'>DNN</b><b class='flag-5'>推理</b>领域的应用

    新兴DNN推理领域的FPGA

    电子发烧友网站提供《新兴DNN推理领域的FPGA.pdf》资料免费下载
    发表于 09-15 10:09 0次下载
    新兴<b class='flag-5'>DNN</b><b class='flag-5'>推理</b>领域的FPGA

    机器学习和人工智能可轻松地满足存储需求

      数据存储 人工智能 机器学习   随着公司运营日益数字化,需要满足的数据存储需求越来越多。它们可能包括关于丢弃信息之前保留信息多长时间、保留数据的位置以及如何确保其安全的具体信息。   幸运
    的头像 发表于 09-13 09:08 569次阅读

    Microchip(微芯)推出MPLAB机器学习开发工具包

    机器学习(ML)正成为嵌入式设计人员开发或改进各种产品的标准要求。为满足这一需求,Microchip(微芯)近日推出了全新的MPLAB®机器
    的头像 发表于 09-12 18:26 706次阅读
    Microchip(微芯)推出MPLAB<b class='flag-5'>机器</b><b class='flag-5'>学习</b>开发工具包

    Microchip 推出 MPLAB® 机器学习开发工具包,助力开发人员轻松将机器学习集成到 MCU 和 MPU中

    机器学习 (ML) 正成为嵌入式设计人员开发或改进各种产品的标准要求。为满足这一需求,Microchip Technology Inc.(美国微芯科技公司)近日推出了全新的 MPLAB
    的头像 发表于 09-11 15:55 403次阅读

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法?
    的头像 发表于 08-17 16:30 1610次阅读

    机器学习是什么意思?机器学习属于什么分支?机器学习有什么用处?

    机器学习是什么意思?机器学习属于什么分支?机器学习是什么有什么用处?
    的头像 发表于 08-17 16:30 1448次阅读

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    机器学习算法入门 机器学习算法介绍 机器学习算法对比 机器
    的头像 发表于 08-17 16:27 707次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点?
    的头像 发表于 08-17 16:11 1289次阅读

    机器学习和深度学习的区别

    机器学习和深度学习的区别 随着人工智能技术的不断发展,机器学习和深度学习已经成为大家熟知的两个术
    的头像 发表于 08-17 16:11 3684次阅读

    深度学习框架区分训练还是推理

    深度学习框架区分训练还是推理吗 深度学习框架是一个非常重要的技术,它们能够加速深度学习的开发与部署过程。在深度学习中,我们通常需要进行两个关
    的头像 发表于 08-17 16:03 1137次阅读

    如何用PyArmNN加速树莓派上的ML推理

    。氖是设计: •更快的视频处理 •图像处理 •语音识别 •机器学习 Neon提供单指令多数据(SIMD)指令,其中多处理 管道中的元素同时对多个数据点执行操作。Arm NN提供 利用Neon后端功能
    发表于 08-02 15:40

    创建一个边缘机器学习系统

    本指南适用于系统设计人员,可能使用Arm Flexible access程序。 本指南将帮助您开发可以执行机器学习的片上系统(SoC)在边缘。本指南中介绍的SoC可以处理与机器学习相关
    发表于 08-02 11:02