0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国重夺超算霸主,GPU提供56%的总算力

DPVg_AI_era 来源:未知 作者:胡薇 2018-06-28 15:59 次阅读

在近日举行的ISC会议上,最新Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,中国的神威·太湖之光排名第二。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。但在进入榜单的系统数量方面,中国仍然远超美国。

TOP500是针对全球已知最强大的计算机系统做出排名与详细介绍的项目。此项目始于1993年,今年已经是第25年。TOP500每年公布两次最新的超级计算机排名,一次是在6月份的国际超级计算机大会(ISC),第二次则是在11月份的全球超级计算大会(SC)。

近日举行的ISC会议上,最新一期Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,两个新系统进入前5。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。

Summit超级计算机。来源:橡树岭国家实验室

由IBM总包设计建设,目前在美国能源部(DOE)的橡树岭国家实验室(ORNL)运行的Summit超级计算机,在作为TOP500榜单基准的高性能Linpack(HPL)基准测试中以122.3 petaflops(每秒12.23亿亿次)的性能问鼎榜首。Summit超算有4356个节点,每个节点配备2颗22核的Power9 CPU和6颗NVIDIA Tesla V100 GPU。节点与Mellanox双轨EDR InfiniBand网络连接在一起。

Summit的Linpack测试的理论峰值性能是187.7 petaflops。在Linpack测试中,Summit超算提供122.3 petaflops的性能,计算效率达到65.2% ——这对新机器来说并不差,而且显然会随着时间的推移而改善。

排名第二的是中国的神威·太湖之光,由国家并行计算机工程技术研究中心(NRCPC)开发,安装在国家超级计算无锡中心。该系统在过去两年里一直名列榜首,自2016年6月上线以来,它的HPL成绩一直保持不变,为93 petaflops。神威·太湖之光在Linpack性能测试中的计算效率达到74.2%,达到93 petaflops的性能的功耗为15.37百万瓦(megawatts),而Summit系统达到122.3 petaflops性能的功耗仅8.81百万瓦。

美国能源部劳伦斯利弗莫尔国家实验室的新系统Sierra排名第三,它的HPL性能是71.6 petaflops。同样由IBM打造的Sierra超算的架构与Summit非常相似,有4320个节点,每个节点均由两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU驱动,并使用相同的Mellanox EDR InfiniBand作为系统互连。

天河二号尽管经过了一次重大升级,用定制的Matrix-2000协处理器取代了5年前的Xeon Phi加速器,但它还是下降了两名,由6个月前的第二名变成第四名。天河二号的新硬件将其HPL性能从33.9 petaflops提高到61.4 petaflops,同时将功耗略微提高了约4%。天河二号由中国国防科技大学(NUDT)开发,部署在国家超级计算广州中心。

AI Bridging Cloud Infrastructure (ABCI)是排名第五的系统,由日本富士通公司制造,它的HPL性能达到19.9 petaflops。ABCI由20核的Xeon Gold处理器和NVIDIA Tesla V100 GPU驱动,安装在日本国家先进工业科学技术研究所(AIST)。

瑞士的Piz Daint (19.6 petaflops)、美国的Titan (17.6 petaflops)、美国的Sequoia (17.2 petaflops)、美国的Trinity (14.1 petaflops),和美国的 Cori (14.0 petaflops) 分别排第6位至第10位。

TOP500的前10名

TOP500榜单中国超算数量超过美国

接下来我们看看TOP500的一些关键概况。

尽管美国在榜单上的排名靠前,但目前美国在榜单上的系统只有124套,创历史新低。就在6个月前,美国在榜单上的系统还有145套。与此同时,中国进入榜单的系统达到206套,占比41%,6个月前是202套。接着是日本,有36套系统,英国22套,德国21套,法国18套。这些数字与上次的榜单基本相同。

国家超算数量年度变化

不过,主要归功于Summit和Sierra,美国在性能方面从中国手中夺回了领先地位。目前,美国的系统占TOP500系统性能总和的38.2%,中国排在第二位,占29.1%。

今年是第一次TOP500榜单的所有500套系统的总性能超过百亿亿次级别(exaflop),确切地说,已经达到1.22 exaflops。这比去年11月时的 845 petaflops 要高。其中,有273套系统的HPL性能超过1 petaflops,而上次的榜单超过只有181套系统性能超过1 petaflops。

CPU架构Intel Xeon占主导地位,56%的计算来自GPU

就处理器架构而言,Intel Xeon在CPU架构方面占据主导地位。

未来几年,IBM和AMD可能会分别凭借Power和Epyc处理器迎来复兴,而Arm服务器芯片也将从中分得一杯羹。但即便如此,Intel Xeon仍将继续在CPU方面占据主导地位。

在加速器方面,TOP500系统中有110个使用加速器,相比2017年11月时的101个加速系统略有增加。TOP500超算的总体性能有一半来自某种形式的加速系统。这些使用加速器的系统中有96个使用NVIDIA GPU,其中前10名就有5个:Summit,Sierra,ABCI,Piz Daint和Titan。此外,使用加速器的系统中有7个配备了Xeon Phi协处理器,而PEZY加速器被用在4个系统中。另外20个系统使用Xeon Phi作为主处理器。

TOP500的几乎所有超级计算机(97.8%)都由拥有8个或更多内核的主处理器驱动,超过一半(53.2%)的主处理器有超过16个内核。

10G或更快的以太网在247个系统中被使用,比6个月前榜单的228个多。此外,139个系统使用InfiniBand,比上次榜单的163个少。有38个系统使用英特尔的Omni-Path技术,上次的榜单是35个。

TOP500榜单中,56%的计算来自GPU。越来越多的厂商开始谈论“人工智能超级计算机”(AI supercomputers),因为可以加速传统HPC工作负载的CPU-GPU混合架构也可以用于机器学习训练。

自1993年以来,TOP500的总性能、排名第一以及排名500的超算性能变化如下图所示:

另一个变化是,榜单中学术、机密和研究类型的超算有所减少,而用于工业的超算比例增加了:

以下是按系统份额的厂商排名,联系有122套系统上榜,占23.8%,其次是HPE,15.8%(79套系统),浪潮,13.6%(68套系统),Cray, 11.2%(56套系统),曙光, 11%(55套系统)。

尽管IBM拥有前三名超级计算机中的两款:Summit和Sierra,但它在整个榜单中只有19套系统。然而,由于这两台机器,IBM贡献了TOP500总性能的19.9%。接着是Cray,性能份额为16.5%,联想为12.0%,HPE为9.9%。

Green500榜单

最后,我们看一下Green500的榜单。Green500中排名前三的超算都来自日本,它们基于ZettaScaler-2.2架构,使用PEZY-SC2加速器。而前10名中的其他系统都使用NVIDIA GPU。

最高能效的超级计算机仍然日本理研的Shoubu(菖蒲) system B,能效为18.4 gigaflops/watt,在TOP500榜单中排名第362位。

能效排名第二的是位於日本高能加速器研究组织/KEK的Suiren2系统,达到16.8 gigaflops/watt,在TOP500榜单中排名第388位。

Green500的第三名是美国的DGX SaturnV Volta系统,接着是Summit(美国),TSUBAME 3.0(日本),AIST AI Cloud(日本),AI Bridging Cloud Infrastructure(日本),new IBM MareNostrum P9 cluster(西班牙),DOE’s Summit system(美国),以及Wilkes-2(英国)。

作为不依赖任何加速器的最高能效的超级计算机,神威·太湖之光在Green500榜单上排第22位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128673
  • 超级计算机
    +关注

    关注

    2

    文章

    460

    浏览量

    41919

原文标题:【GPU称霸超算TOP500最新榜单】美国重夺全球超算霸主,总算力56%来自GPU

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解芯片GPU

    着色器(Pixel shader)是图形流水线中相当强大的功能单元,因为它可以为每个片段执行复杂的计算,从而为最终渲染的图像添加细节和视觉效果。 DirectX API推动 GPU 演进
    发表于 11-03 12:55

    GPU开发平台是什么

    随着AI技术的广泛应用,需求呈现出爆发式增长。AI租赁作为一种新兴的服务模式,正逐渐成为企业获取
    的头像 发表于 10-31 10:31 120次阅读

    【一文看懂】大白话解释“GPUGPU

    随着大模型的兴起,“GPU”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中,什么是GPU,它与CPU的区别是什么?以及到底什么是GPU
    的头像 发表于 10-29 08:05 251次阅读
    【一文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

    未来边缘GPU在车联网中的创新应用

    的发展提供了强大的技术支撑。未来边缘GPU在车联网中的应用及创新,将有力推动车联网技术的快速发展,提升交通运行效率,降低交通事故发生率,为人们创造更加安全、便捷
    的头像 发表于 10-25 08:08 181次阅读
    未来边缘<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>在车联网中的创新应用

    GPU租用平台怎么样

    GPU租用平台以其成本效益、灵活性与可扩展性、简化运维以及即时访问等优势,在深度学习、科学计算、图形渲染等多个领域发挥着重要作用。
    的头像 发表于 10-17 10:03 157次阅读

    GPU租用平台是什么

    GPU租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
    的头像 发表于 10-16 10:15 160次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑 感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。 本书主要讲芯片CPU
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    更高、更密集的应用需求。 12年前,我与本书作者相识时,他向我提出一个想法:建立中关村在线高性能计算频道。该频道隶属于核心硬件事业部,聚焦芯片相关的产品技术分析、评测,并为企业客户提供内部参考。后来
    发表于 09-02 10:09

    服务器为什么选择GPU

    随着人工智能技术的快速普及,需求日益增长。智中心的服务器作为支撑大规模数据处理和计算的核心设备,其性能优化显得尤为关键。而GPU服务器也进入了大众的视野,成为高性能计算的首选。那
    的头像 发表于 07-25 08:28 492次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服务器为什么选择<b class='flag-5'>GPU</b>

    IaaS+on+DPU(IoD)+下一代高性能底座技术白皮书

    DPU 是当下基础设施的核心创新之一。如果把 CPU 比做大脑,那么 GPU 就好比是肌肉,而 DPU 就是神经中枢。CPU 承载了应用生态,提供了通用型
    发表于 07-24 15:32

    壁仞科技为中国移动呼和浩特智中心提供强大

      随着人工智能技术的飞速发展,高性能计算中心成为推动AI创新和应用的关键基础设施。近日,中国移动智中心(呼和浩特)成功上线运营。国内领先的GPU企业壁仞科技的壁砺系列通用GPU
    的头像 发表于 07-05 17:16 1237次阅读

    “捷智”正式入驻国家互联网平台

    ABSTRACT摘要2024年4月2日,本公司旗下服务品牌“捷智”正式入驻国家互联网平台,开设云
    的头像 发表于 04-12 08:26 484次阅读
    “捷智<b class='flag-5'>算</b>”正式入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    智能规模通用,大模型对智能提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   可以分为通用、智能
    的头像 发表于 02-06 00:08 6072次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    GPU是显卡吗 cpu和gpu哪个

    很大的区别,因此它们的计算能力也不同。 首先,我们来看一下CPU(中央处理器)的。CPU是一种通用处理器,它被设计用于处理各种不同类型的任务,包括数据处理、指令执行、逻辑控制等。CPU的核心数量和频率是衡量其
    的头像 发表于 01-10 15:45 5038次阅读