0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球超算500强出炉 美国新超算“顶点”反超中国神威排位第一

章鹰观察 来源:cnBeta网站 作者:cnBeta网站 2018-06-26 10:36 次阅读

6月25日报道,新一期全球超级计算机500强榜单25日发布,美国超级计算机“顶点”超过中国的“神威·太湖之光”名列第一。这是美国超级计算机多年后重回榜首。不过,排行榜上中国的超算系统总数仍居第一。美国橡树岭实验室(Oak Ridge National Laboratory)在6月初公布了其新超算“顶点”(Summit),理论速度达到了每秒20亿亿次,由IBM提供技术采用了9216颗IBM Power 9处理器驱动,27648颗NVIDIA Volta做加速卡。在本周一,全球超算TOP500的新榜单正式发布,正式确认Summit超算为全球最强超算,也是美国在第五年屈居第二后成功超越的中国超算神威-太湖之光,重回第一。

在超算500强榜单的基于Linpack基准测试评定上,Summit的浮点运算速度为每秒12.23亿亿次,峰值接近每秒18.77亿亿次。排名第二的是曾4次蝉联冠军的中国超算“神威·太湖之光”,其浮点运算速度没有变化,仍维持在每秒9.3亿亿次。随后排在第三至五位的超算依次是美国能源部下属劳伦斯利弗莫尔国家实验室的“山脊”,中国超算“天河二号”、日本超算“人工智能桥接云基础设施”(ABCI)。

尽管美国在超算方面仍然占据主流,但是中国超算数量持续增加,其跻身500强的超算比例逐年增高,由2017年的201台增加至206台,仍有更多在建的超算有望再次赶超美国,美国的500强超算数量由143台跌至124台。另一个趋势,全球500强超算中采用加速卡的台数也由101台增至110台。

性能超神威·太湖之光2倍

美国Summit超级计算机现在已经在美国橡树岭国家实验室运行,峰值运算速度达到200 petaflops,是神威·太湖之光的2倍多。如无意外,它将在本月底公布的Top 500榜单中名列第一,让美国重夺“世界上最强大超算”桂冠。而且,它的设计非常适应人工智能技术,被誉为“最聪明超算”。

备受关注的美国Summit超级计算机现在已经在美国橡树岭国家实验室(ORNL)运行。这台新的超级计算机被非官方地称为“世界上最强大的计算机”。而且,它的设计部分是为了扩大人工智能技术的应用范围。

自2013年6月“世界最强超算”的桂冠被中国的神威·太湖之光超级计算机摘取以来,美国一直没有拥有夺回这个称号。Summit超算预计在本月晚些时候正式发布,届时国际“TOP 500”组织将正式发表世界超级计算机Top 500榜单。除非中国本月爆出大惊喜,否则新的排名公布后,Summit将使美国重回超算Top 500榜单的第一名。

尽管在云计算和大型数据中心的时代,超级计算机已经失去了一些吸引力。但许多棘手的计算问题仍需要大型的机器。美国政府去年发布的一份报告提出,美国应加大对超级计算机的投资,以便在核武器和高超音速飞机等国防项目,以及航空、石油勘探和制药等领域的商业创新等方面赶上中国。

Summit:比普通笔记本电脑快100万倍,比神威·太湖之光快2倍

Summit超算由IBM和NVIDIA为美国能源部的橡树岭国家实验室制造,其占地面积相当于两个网球场大小,为了冷却其37000个处理器,周围的循环系统每分钟要消耗4000加仑的水。尽管美国能源部(DOE)尚未透露Summit的Linpack测试结果,但橡树岭国家实验室表示,Summit的峰值运算速度达到200 petaflops,也就是每秒浮点运算次数达到200千兆次。这比普通笔记本电脑的运算速度快100万倍,是神威·太湖之光(93.01 PFLOPS)峰值性能的两倍有多。

200 petaflops是什么概念呢?如《纽约时报》所述,一个人需要花630亿年的时间来完成Summit一秒钟内可以完成的计算。而MIT技术评论说,“地球上的每个人每天每秒钟进行一次计算,持续305天,才能完成Summit超算眨眼之间可以做完的事情。”

尽管Summit的基本规格已经公开有一段时间了,但这里还是有必要重新介绍一下:Summit由4608个节点组成,每个节点包含两个Power9 CPU和6个NVIDIA Tesla V100 GPU。节点与Mellanox双轨EDR InfiniBand网络连接在一起,为每台服务器提供200 Gbps的速度。

假设所有这些节点都配备齐全,GPU单独将以双精度提供峰值215 petaflops。此外,由于每个V100还提供125 teraflops的混合精度 Tensor Core 操作,系统对深度学习运算的峰值性能大约为3.3 exaflops。

exaflops级的性能也不仅仅是理论上的。根据ORNL主任Thomas Zacharia的说法,在早期的测试中,橡树岭国家实验室的研究人员在一个分析人类基因组序列变化的项目中,使用Summit超算每秒进行了超过10的18次方次的计算。他们声称这是科学计算第一次达到这样的计算规模。

最适合机器学习的超级计算机

美国新推出的这台最强超算不仅仅对计算力的地缘政治意义重大。它的设计比以前的超级计算机更适合运行谷歌、苹果等科技公司流行的机器学习技术。

研究人员发现,图形芯片可以为深度神经网络技术提供更多计算力,这也是计算机可以在声音识别、棋盘游戏等方面打败人类的一个原因。Facebook最近披露,一个使用数十亿张Instagram照片的人工智能实验,在近一个月的时间里占据了数百张显卡。

Summit拥有近28000个英伟达(Nvidia)生产的图形处理器,以及IBM生产的9000多个传统处理器。对于超级计算机来说,使用大量的图形芯片是不常见的,因此它应该能在部署机器学习以处理艰难的科学问题方面实现突破。橡树岭国家实验室主任Thomas Zacharia说:“我们打造了世界上最强大的超级计算机,但它也是世界上最聪明的超级计算机。”

当然,Summit还将支持美国能源部最感兴趣的标准科学规范,特别是那些与核聚变能源、替代能源、材料科学、气候研究、计算化学和宇宙学等相关的科学规范。但由于这是开放的科学系统,可用于所有类型的研究,可以与能源无关。Summit也将用于医疗保健的应用领域,如药物发现、癌症研究、成瘾和其他类型的疾病研究。事实上,在宣布该系统投入使用的新闻发布会上,Zacharia表示,他希望橡树岭国家实验室成为“医疗数据分析领域的欧洲核子研究中心”。

“分析”与Summit的深度学习倾向非常吻合,因为前者实际上是后者的叠加。早在2014年,当美国能源部第一次签约Summit系统时,能源部可能只对他们将得到的AI能力有一个粗略的概念。尽管IBM在将Power9-GPU平台提交给美国能源部之前一直在宣传其以数据为中心的超级计算方法,但当时人工智能/机器学习应用领域仍处于初级阶段。由于NVIDIA决定将专用的 Tensor Cores 集成到V100中,Summit最终成为了一个AI巨兽,同时也是一个强大的HPC机器。

因此,除了高性能计算的之外,该系统还可能参与大量尖端的人工智能研究。目前,Summit只对经选择的项目开放。到2019年,该系统将变得更加广泛可用,包括将用于理论与实验创新计算项目(INCITE)。

到时,Summit的前任Titan超级计算机很可能会退役。Summit的性能约为Titan的8倍,能效提高5倍。当橡树岭在2012年安装Titan时,它是当时世界上最强大的系统,也是美国最快的超级计算机(现在是第二快)。Titan也拥有NVIDIA GPU,但这些都是K20X图形处理器,其机器学习能力仅限于每个设备四个单精度teraflops。幸运的是,为Titan开发的所有支持GPU的HPC的代码都应该能够轻松移植到Summit上,并且应该能够充分利用V100更高的计算能力。

伊利诺伊大学厄巴纳-香槟分校国家超级计算应用中心的研究员Eliu Huerta将Summit的庞大GPU池描述为“像梦境一样”。Huerta此前曾在一台名为Blue Waters的超级计算机上使用机器学习技术,在LIGO天文台的数据中探测引力波。LIGO天文台的两位创始人因此获得了2017年诺贝尔物理学奖。Huerta希望Summit的成果将有助于分析预计将于2019年启用的大型天气观测望远镜每晚接收到的约15 TB的图像。

Summit还将被用于在化学和生物学的问题中利用深度学习技术。 Zacharia说,这项研究可能有助于能源部的一个项目,该项目使用来自2200万退伍军人的医疗记录,其中包括大约25万人的完整基因组序列。

有些人担心美国在超大规模计算机上的竞争力,他们希望,Summit将激发对打造其继任者的更多兴趣。

Summit还将发挥另一个重要作用,即为E级科学应用提供一个发展平台。作为橡树岭国家实验室的最后一个petascale系统,这台200 petascale的超算将成为未来几年一系列HPC代码向exascale机器转移的垫脚石。现在,随着Summit的完成,这似乎不再是一个遥远的前景了。“毕竟,(E级计算)离我们现在的超算能力只差5倍,”Zacharia笑着说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超级计算机
    +关注

    关注

    2

    文章

    464

    浏览量

    42019
  • 人工智能
    +关注

    关注

    1796

    文章

    47643

    浏览量

    240179
  • 机器学习
    +关注

    关注

    66

    文章

    8438

    浏览量

    133046
  • 运算速度
    +关注

    关注

    0

    文章

    6

    浏览量

    2892
收藏 人收藏

    评论

    相关推荐

    融合 南京信易达发布全新“智能力融合平台”

    1月7日,南京信易达发布了旗下最新力平台“C-MOM智能力融合平台V3.0”,并更新了全新的UI视觉与交互系统。 该平台集成了HPC中心、AI智
    的头像 发表于 01-08 10:56 141次阅读
    <b class='flag-5'>超</b><b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合 南京信易达发布全新“智能<b class='flag-5'>算</b>力融合平台”

    本源“量融合先进计算平台”入选2024中国·年度重大成果

    近日,2024中国力大会在河南郑州开幕。大会主论坛上,“中国·年度重大成果”正式发布8项具有突破性意义的技术成果。本源量子与郑州大学国家超级计算郑州中心联合申报的“量
    的头像 发表于 10-16 08:06 417次阅读
    本源“量<b class='flag-5'>超</b>融合先进计算平台”入选2024<b class='flag-5'>算</b>力<b class='flag-5'>中国</b>·年度重大成果

    澎峰科技受邀出席国家互联网生态沙龙

    “国家互联网生态沙龙”在长沙举行,由国家互联网联合体举办,本次沙龙聚焦工业数智化创新发展,邀请了众多行业领袖和专家共同探讨新材料、新能源等前沿领域的人工智能背景下数字化转型。澎
    的头像 发表于 09-29 10:13 463次阅读

    预定下代第一?富士通144核Arm处理器公开

    电子发烧友网报道(文/周凯扬)相信对市场有过定了解的朋友,都对曾经的第一名富岳不陌生。
    的头像 发表于 06-24 00:26 2874次阅读
    预定下代<b class='flag-5'>超</b><b class='flag-5'>算</b><b class='flag-5'>第一</b>?富士通144核Arm处理器公开

    QPU与GPU,经典和量子计算的协同

    电子发烧友网报道(文/李宁远)不久前在国际大会ISC上, NVIDIA宣布将通过开源的 NVIDIA CUDA-Q量子计算平台,助力全球各地的国家级
    的头像 发表于 05-21 01:35 2645次阅读

    训练大模型,不浪费丁点计算资源

    政府也投入到LLM的计算资源整合中来,从而不至于落后这轮新的全球技术军备战。同样的计算资源竞争也发生在领域,而两者的计算资源存在定的重合,不少人开始借助
    的头像 发表于 05-20 07:08 907次阅读

    最新Top500榜单公布:Frontier再夺魁首,Aurora破百亿大关

    此次Top500排行榜中只有个显著变动:瑞士国家超级计算机中心的Alps凭借270 PFlop/s的Rmax LINPACK FP64
    的头像 发表于 05-14 09:36 891次阅读

    “本源悟空”已受邀成功联机中国三个中心

    继上线量融合先进计算平台入驻国家互联网平台后近日,我国第三代自主超导量子计算机“本源悟空”成功联机长三角枢纽芜湖集群力公共服务平台该平台支持跨
    的头像 发表于 05-08 08:22 564次阅读
    “本源悟空”已受邀成功联机<b class='flag-5'>中国</b>三个<b class='flag-5'>超</b><b class='flag-5'>算</b>中心

    科学计算的下轮创新,AI与数字孪生

    应用的行列中来。   AI 与数字孪生   在过去通用计算负载的时代,我们难以采用更大规模的计算集群来打造数字孪生。可随着AI技术,尤其是生成式AI技术的出现,采用高度定制化的AI
    的头像 发表于 05-07 00:16 2058次阅读
    科学计算的下<b class='flag-5'>一</b>轮创新,AI<b class='flag-5'>超</b><b class='flag-5'>算</b>与数字孪生

    云助力西云力腾飞,荣膺2024全国“人工智能+”创新案例百

    近日,云凭借其在人工智能领域的深厚积淀和技术实力,成功入选2024年度全国“人工智能+”行动创新案例100榜单,此殊荣不仅是对云在AI技术创新和应用实践层面卓越表现的认可,更是对其在赋能西云
    的头像 发表于 04-19 17:09 382次阅读
    <b class='flag-5'>超</b>云助力西云<b class='flag-5'>算</b>力腾飞,荣膺2024全国“人工智能+”创新案例百<b class='flag-5'>强</b>

    “捷智”正式入驻国家互联网平台

    ABSTRACT摘要2024年4月2日,本公司旗下力服务品牌“捷智”正式入驻国家互联网平台,开设云gpu旗舰店。我们将借助国家
    的头像 发表于 04-12 08:26 664次阅读
    “捷智<b class='flag-5'>算</b>”正式入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    千亿美元打造个系统,成本越来越高的AI

    电子发烧友网报道(文/周凯扬)从近年来新发布的算机器和新的HPC AI性能榜单可以看出,AI力已经在中成了不可忽视的性能指标之,但
    的头像 发表于 04-09 00:19 3127次阅读

    中国第三代自主超导量子计算机“本源悟空”入驻国家互联网

    量子计算机“本源悟空”上线运行。截至4月1日,全球范围内115个国家逾477万人次远程访问“本源悟空”,成功完成16.8万个全球量子计算任务。这是中国自主量子
    的头像 发表于 04-04 08:21 373次阅读
    <b class='flag-5'>中国</b>第三代自主超导量子计算机“本源悟空”入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网

    COMSOL Multiphysics在材料与表面仿真中的应用

    作为款强大的多物理场仿真软件,为材料和表面的研究提供了强大的仿真工具。本文将重点介绍COMSOL Multiphysics在周期性表面透射反射分析中的应用,以期为相关领域的研究
    发表于 02-20 09:20

    智能力规模通用力,大模型对智能力提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   力可以分为通用力、智能力和算算力。早前通用力占整体
    的头像 发表于 02-06 00:08 6522次阅读