0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第三次AI浪潮革命,百万倍算力挑战大起底

独爱72H 来源:刘林华 作者:电子发烧友 2019-02-05 13:55 次阅读

AI第三次浪潮革命是在算力激增的推动下发生的。Jeff Dean说我们需要超过现在100万倍的算力,成为企业面临的重大挑战。本文通过硬件基础、软件基础以及优化框架和应用加速4个方面,为您起底百万倍算力挑战。

AI这个词,从第一次被创造出来至今,已经经历了两次浪潮。如今在算法、大数据、算力三大因素的驱动下,AI发展迎来第三次浪潮。

谷歌AI负责人Jeff Dean说:“事实证明,我们真正需要的是超过现在100万倍的计算能力,而不仅仅是几十倍的增长。”

算力为王的年代,企业需要满足4个层次的需求:

硬件,一些计算平台比如服务器、加速卡等。这是算力的物理根基,是满足算力的第一步

软件,构建在硬件之上的开发管理套件,提供整体解决方案,可以让用户无需掌握高深的AI知识,直接根据需要进行开发

优化主流框架,针对硬件和管理套件进行定制化,使得算力能够更加快速稳定

应用加速,AI端到端的解决方案,将算力落地

这就给传统企业带来了前所未有的挑战。一方面,越来越多的传统企业需要尽快转型AI;另一方面,传统企业已经无法应对AI时代的算力挑战。

提高整个AI计算系统的性能与效率迫在眉睫,而首当其冲的,就是服务器和加速卡。

解决算力需求的硬件基础:服务器和加速卡

企业的规模越大,数据的集中度就越高,对AI计算力的需求也就越高,对AI服务器的需求也就约旺盛。

根据国际调研公司IDC)全球季度服务器跟踪报告,2018年第三季度全球服务器市场,供应商收入达234亿美元(约1581亿人民币),同比增长37.7%。全球服务器出货量320万台,同比增长18.3%。

在全球服务器市场,排名前五的分别是:DELL EMC第一、HPE/New H3C Group第二、Inspur/Inspur Power第三、Lenovo第四、 IBM,Huawei和Cisco并列第五。

具体数据如下图:

可以看到,在服务器市场TOP 5的7家厂商中,浪潮表现的最为亮眼,出货量同比增长90.2%,营收增长达增长156.5%。

杭州的阿里,北京的京东、字节跳动(今日头条)、百度,深圳的腾讯,都对当地AI计算力产生巨大的需求。

能够胜任BAT算力要求的企业不多。在AI算力供应商的问题上,BAT纷纷选择了浪潮。

浪潮能够连续多年成为BAT最主要的AI服务器供应商,靠的是不断提升计算能力的AI服务器:

AI超级服务器AGX-5,单机配置16颗NVIDIA Tesla V100 Tensor Core 32GB GPUs,AI计算性能高达每秒2千万亿次,可支持4倍超大规模深度神经网络模型,并将训练速度提高10倍。

AGX-2服务器,采用P100的Linpack浮点运算性能达29.33TFLOPS,在2U空间内支持部署8块NVLink或PCI-E。在AI深度学习模型训练上,采用TensorFlow框架和GoogLeNet模型,AGX-2处理速度为每秒1165幅图片。

智能视频分析服务器NF5280M5-V,在2U空间内配置8片NVIDIA TESLA P4 GPU,单台服务器即可完成96路高清摄像头视频数据的解码及结构化实时处理需求。同时最大可提供96TB本地存储空间,可将视频处理数据的保存周期最高延长至6个月。

弹性GPU服务器NF5468M5,专注于AI云。可同时处理300路以上1080p高清视频结构化,支持288TB大容量存储或32TB固态存储,实现高达400Gbps通信带宽和1us的超低延迟。

这些服务器,同时也在为科大讯飞、商汤、旷视、字节跳动、滴滴等AI领先公司,在语音、图像、视频、搜索、网络等方面提供了算力支持。

除了AI服务器,浪潮还发布了全球首款集成HBM2高速缓存FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,实现高性能、高带宽、低延迟、低功耗的AI计算加速。

有了AI服务器和加速卡,仅仅是解决了算力需求的第一步:硬件基础设施。接下来,就需要管理套件的跟进,实现软件平台基础。

解决算力需求的软件基础:AI开发平台

解决了算力的硬件基础,企业还需要解决快速构建AI开发平台,进行人工智能产业布局的难题。

这个时候,一套能够实现对计算、存储、网络等基础资源的管理和调度的完整解决方案就非常必要了。

浪潮升级了AI高效开发管理平台AIStation,致力于提供高效、易用的人工智能开发平台。

同时AIStation还集成了主流的AI开源框架和深度学习模型,提供完整的AI开发工作流服务。

除了AIStation外,浪潮还发布了OpenStack AI云平台。

根据工信部华信研究院提供的数据显示,2018年OpenStack占据私有云60%的市场。

OpenStack AI云平台可帮助行业AI用户快速便捷的构建CPU+GPU的弹性异构云环境,并实现对异构计算资源池的动态调度与分配,支撑数据管理、模型训练、模型部署等各类AI应用场景。

通过对GPU虚拟机的支持,浪潮OpenStack AI云平台能够以多租户的形式,按需分配异构计算资源,从而实现AI敏捷开发。

同时,多租户任务排队策略、资源分组优化策略、租户资源配额集均衡策略以及GPU共享策略等精细化调度策略,也进一步提高了GPU资源的利用率。

有了管理套件后,接下来就应该深入到更细节的框架优化中了。

进一步提升算力方法:框架优化

要满足算力的不断提升,旧有的计算框架已经无法满足新的性能需求,需要不断的进行优化。

目前使用比较广的框架包括TensorFlow、PyTorch和Caffe。

TensorFlow是一款强大而成熟的深度学习框架,有强大的可视化性能,以及用于高水平模型开发的多个选项。它具备生产就绪的部署选项,支持移动平台。

Caffe用来做计算机视觉,HPC和数值优化的研究,加上产品线里的高效部署。

PyTorch用来做非常dynamic的研究加上对速度要求不高的产品

对于企业来说,由于TF和Caffe的高效部署选项,基于TF和Caffe的框架优化就显得更有意义。

浪潮针对TF和Caffe推出了Caffe-MPI, TensorFlow-Opt, FPGA计算加速引擎TF2等优化方案。

Caffe-MPI

Caffe-MPI是全球首个集群并行版的Caffe深度学习计算开源框架,针对高性能计算系统设计使之具备良好的并行扩展性。

新版本在4节点16块GPU卡集群系统上训练性能较单卡提升13倍,其每秒处理图片数量是同配置集群运行的TensorFlow 1.0的近2倍。

Caffe-MPI设计了两层通信模式,非常适合现在的高密度GPU服务器。同时Caffe-MPI还设计实现了计算和通信的重叠,提供了更好的cuDNN兼容性,用户可以无缝调用最新的cuDNN版本实现更大的性能提升。

TensorFlow-Opt

TensorFlow-Opt已完成了ResNet-50、ResNet-101和VGG16(batch size=128 & 256)等多个网络模型的测试。

其中,在ResNet-50网络模型下(单卡batchsize=256),512块GPU每秒可训练128336张图片,即训练完成一个完整的ImageNet数据集(128万张图片)只需要约10秒时间,打破了AI训练性能世界纪录。

FPGA计算加速引擎TF2

FPGA计算加速引擎TF2支持TensorFlow,可帮助AI客户快速实现基于主流AI训练软件和深度神经网络模型DNN的FPGA线上推理,并通过全球首创的FPGA上DNN的移位运算技术获得AI应用的高性能和低延迟。

TF2计算加速引擎提高了FPGA上AI计算性能,降低了FPGA的AI软件实现门槛,将支持FPGA广泛应用于AI生态推动更多AI应用落地。

经过AI服务器提供算力的硬件基础,管理套件提供软件平台基础,优化框架保证紧跟算力不断增长的需求,最后就是为应用提供加速。

实现算力需求的落地应用:案例解析

目前,浪潮在智能视频分析、医疗影像、电力设备巡检、金融汇率预测、语音识别、AI云等应用中,已经有了很多成功案例。

成功案例一:智能安防

视频科技领域AI应用的场景化非常分散,需要提炼应用场景,根据应用规模,在解决方案中按需灵活组合各种产品。

浪潮人工智能专家团队与大华合作建立了超强计算力为核心的计算平台和计算集群单元。

在硬件上,使用AGX-2集群来处理视频相关业务计算。在管理套件上,针对智能安防的应用场景,定制开发了AIstation管理平台。

优化后的AIStation平台,可以秒级构建AI环境,实现GPU资源智能调度,整体效率大幅提升,降低运维成本。

目前大华股份与浪潮已经在智慧城市、雪亮工程、平安城市等多个领域共同打造信息化联合解决方案,共同促进智能物联网行业智能化、信息化转型升级和跨域发展。

成功案例二:首钢园落地项目

北京首钢自动化信息技术有限公司,采用了浪潮和百度联合推出的ABC一体机3.0的钢包质检解决方案后,10000张钢材照片的整体缺陷识别分类准确率达到99%以上,比人工专业检测的准确率更高。

成功案例三:语音识别一体机

浪潮与科大讯飞联合发布了面向于语音识别、翻译等AI应用的16卡计算集群“AI Booster”,单套系统能够实现单精度240TFlops/s或Int8 752TFlops/s的计算性能。

双方公布的实测数据显示,在智能翻译模型训练任务中,采用相同计算卡的“AI Booster”与传统4卡服务器组成的16卡集群相比,AI计算加速比提升18%。

解决算力需求的长期战略:人才培养

除了技术问题,传统行业AI转型还面临AI人才的短缺。在培养人才问题上,浪潮也在积极提供解决方案。

去年在AICC人工智能计算大会上开办集训营,提供了现场动手实践的课程。

打比赛也是一个很好的吸引大学生投入AI学习中的方式。世界三大超算竞赛之一的ASC,就是一个很好的例子。

目前ASC已经吸引了超过7000名来自世界各地的选手,送出了近百万的奖金。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268892
收藏 人收藏

    评论

    相关推荐

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。
    的头像 发表于 11-14 09:30 499次阅读

    AI时代的重要性及现状:平衡发展与优化配置的挑战

    AI时代,扮演着至关重要的角色。如果说数据是AI大模型的“燃料”,那么则是其强大的“动
    的头像 发表于 11-04 11:45 417次阅读

    亿铸科技熊大鹏探讨AI芯片的挑战与解决策略

    在SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技的创始人、董事长兼CEO熊大鹏博士发表了题为《超越极限:大芯片的技术挑战与解决之道》的演讲,深入剖析了AI大模型
    的头像 发表于 10-25 11:52 381次阅读

    三次谐波定子接地保护动作条件

    三次谐波定子接地保护是电力系统中一种重要的保护方式,主要用于保护发电机、变压器等设备的定子绕组。 一、三次谐波定子接地保护的基本原理 1.1 三次谐波的产生 在电力系统中,由于非线性负载、变压器铁芯
    的头像 发表于 07-25 14:57 1025次阅读

    三次谐波对注入式定子接地影响

    引言 随着电力系统的快速发展,电力系统的谐波问题日益突出。三次谐波作为电力系统中常见的一种谐波,对电力系统的安全稳定运行产生了一定的影响。特别是在注入式定子接地系统中,三次谐波的影响尤为明显。 三次
    的头像 发表于 07-25 14:55 722次阅读

    IEEE1901.3标准工作组第三次会议在长沙召开,加速推进PLC双模通信国际标准的制定

    4月11日,IEEE1901.3双模通信国际标准第三次会议在长沙顺利召开。会议由中国电力科学研究院主办,国网湖南省电力公司和深圳合微承办,IEEE1901.3工作组Oleg先生、南方电网公司、国网
    的头像 发表于 04-13 08:08 634次阅读
    IEEE1901.3标准工作组<b class='flag-5'>第三次</b>会议在长沙召开,加速推进PLC双模通信国际标准的制定

    谐波和三次谐波区别 二谐波危害没有三次谐波大?

    谐波和三次谐波区别 二谐波危害没有三次谐波大? 在现代电力系统中,谐波问题逐渐引起人们的关注。谐波是指频率是基波频率的倍数的电流或电压成分。二
    的头像 发表于 04-08 17:11 5799次阅读

    用cubeMX + STM32L0HAL库1.12.1生成的自定义HID设备,接收后发送数据第三次开始会失败卡死的原因?

    用cubeMX + STM32L0HAL库1.12.1生成的自定义HID设备,在接收后发送数据,第三次开始会失败卡死,单独接收和发送没问题,用HAL库1.12.0生成的没问题
    发表于 03-21 08:05

    SpaceX星舰将第三次试飞

    SpaceX公司近日宣布,其巨型火箭星舰即将迎来第三次试飞,旨在进一步测试其性能极限。据悉,这次试飞计划最早于3月14日进行,相比前两,其任务目标更加宏大且复杂。
    的头像 发表于 03-08 13:52 673次阅读

    说说TCP三次握手的过程?为什么是三次而不是两、四

    说说TCP三次握手的过程?为什么是三次而不是两、四? TCP三次握手是建立TCP连接的过程,确保数据的可靠传输。它是由发送端和接收端完成
    的头像 发表于 02-04 11:03 676次阅读

    SpaceX计划2月份进行星际飞船系统第三次飞行测试

    SpaceX公司的高管近日宣布,美国联邦航空局(FAA)计划在今年2月份批准星际飞船系统进行第三次飞行测试。这意味着,星际飞船有望再次升空,继续其太空探索之旅。
    的头像 发表于 01-11 14:35 545次阅读

    SpaceX 星舰计划下月进行第三次试飞

    周二下午,NASA举办的电话会议中,SpaceX客户运营及整合副总裁杰西卡·詹森(Jessica Jensen)透露,公司正积极争取Starship第三次飞行审批,预计最快能在2月拿到许可。
    的头像 发表于 01-11 13:43 554次阅读

    卫星通信序幕拉开,AI浪潮澎湃

    AI浪潮催生要求,基础设施需求持续提升。AIGC带来的超大需求拉动通信基础设施建设及扩容
    发表于 01-03 10:22 388次阅读
    卫星通信序幕拉开,<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>浪潮</b>澎湃

    使用ARM对ADIS16480进行SPI数据读取时,需要发送三次读取指令才能读取到数据是为什么?

    使用ARM对ADIS16480进行SPI数据读取时,需要发送三次读取指令,第三次才能读到第一发送读取数据指令所读到的数据,请问有人知道这个是什么地方配置出错还是什么别的原因
    发表于 12-28 07:26

    AI数据中心的一些挑战

    AI或者人工智能自1956年提出至今已有几十年的历史。过去的几十年里面,人工智能的热度经历了三次浪潮,第一提出人工智能之后出现一些新的技术,也应用到了工业生产上,但是很快大家发现所谓
    发表于 12-25 11:25 549次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>数据中心的一些<b class='flag-5'>挑战</b>