0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2020年中国高性能计算机性能榜单出炉

如意 来源:OFweek电子工程网 作者:未来科技 2020-11-16 10:40 次阅读

11月15日,北京,中国超算“放榜日”。

随着第二届中国超级算力大会的举行,2020中国高性能计算机性能排行榜TOP100揭晓。

榜单的前2位已经五年没有发生更迭,还是熟悉的两个“前全球第一超算”——“神威·太湖之光”和“天河二号A”,它们分别部署在国家超级计算无锡中心和国家超级计算广州中心(注!5年间机器有升级)。

榜单的第3、4位是新面孔。

其中,排在第3位的是北京超级云计算中心(A分区)。其设备供应方为戴尔科技集团,Linpack测试性能达3.743PFlops,峰值性能达7.035PFlops,采用AMD最新的霄龙处理器“罗马”为其提供澎湃算力。北京超级云计算中心由中国科学院与北京市政府共建,位于北京市怀柔科学城。

榜单第4位是部署在内蒙古和林格尔新区的“内蒙古高性能计算公共服务平台”,建设方为清华同方;5~10位由联想深腾8800系列占据。排在榜最后一位的机器性能为1.869PFlops,较去年最后一位性能提升33.2%。

此次榜单看起来虽然变化不大,但综合分析来看,仍有不少亮点。

01

国家超算的大国重器地位不动摇

榜单前两位无锡超算和广州超算,是国家超算的杰出代表。

众所周知,两台设备都曾在全球超算TOP500排行榜上排名第一。其中,天河二号(含升级后的天河二号A)在2013年6月~2015年11月,连续六次在TOP500排名第一;神威·太湖之光在2016年6月~2017年12月,连续四次在TOP500排名第一。

当然,两大国家级超算的贡献绝不止于TOP500的排名,二者对于推动我国超大规模计算机的研制、部署、软件开发、应用等方面同样居功甚伟。

以神威·太湖之光为例。

自2016年该机器夺得全球第一超算的桂冠后,当年,我国科学家杨超等人就凭借运行在其上的千万核级应用,首次摘得“高性能计算领域的诺贝尔奖”——戈登贝尔奖。这一最高奖项在此前的近30年中,一直被美国和日本垄断。

此后的2017年,青年科学家付昊桓等人再次凭借基于神威·太湖之光的应用“非线性地震模拟”帮助中国蝉联“戈登贝尔奖”。

连续两年将“戈登贝尔奖”收入囊中,对于推动我国超算应用发展、提高我国超算软实力,甚至提振中国超算士气方面都有着重要意义。

当然,作为国之重器,国家超算在承担加速学科交叉和信息化发展、加速产业转型与融合升级、培养复合型人才等国家使命方面也扮演着重要的角色。

就拿“天河二号A”来说,多年来一直向大气—海洋环境模拟、天文地球物理、工业设计制造、生物医药健康等方面给予算力和计算应用支撑。

02

通用和行业超算是重要补充

国家级超算都是大家伙、重武器,能够负载万核、十万核甚至千万核以上应用。但是,在“国民经济主战场”,更多的应用是无法企及国之重器这样的高度的,这也要求超算不能只是“王谢堂前燕”,还要“飞入寻常百姓家”。

简单来说,国家超算是国家战略计算装备,不仅要有,还要尽量“大”,和世界一流水平同频共振;而用于各行各业、作为生产工具的通用超算、行业超算,也同等重要,但这类设备追求的不是“大”,而是要追求通用、易用、好用。

这次Top100榜单排在第三位的北京超级云计算中心(A分区),别看它排名靠前,但它是不折不扣的、服务千行百业的通用超算,是国家超算重要的算力补充。

鉴于这一集群系统的代表性,加之此前该集群非常低调,只有很少的公开信息,今次本文以相对长的篇幅做一些介绍和分析。

北京超级云计算中心(不要被名字迷惑,它不是我们常说的云计算,而是以云服务形式提供超算算力的平台)于 2011 年依托中科院计算机网络信息中心成立,北京北龙超级云计算有限责任公司负责运营,位于怀柔科学城。

本次上榜的是北京超级云计算中心的A分区(关于为何“分区”,后文详述),算力规模为3.743PFlops,全部为通用X86超算。

通用X86超算在圈内又被称作“纯CPU通用算力”,这类算力资源,由于生态完善、代码可移植性强等原因,用户友好度非常高。

更值得一提的是北京超级云计算中心提供算力的模式。正如其名,该中心以随需供应的“超级云计算服务”的模式向用户提供算力,这是其最大的特点。

前面说超算要从“旧时王谢堂前燕”“飞入寻常百姓家”,怎么飞?北京超级云计算中心的实践证明,“超级云计算服务模式”就是一种行之有效的方式。

来看几个例子。

03

“超级云计算”的几个案例

成立于1998年的“金风科技”,是我国风电事业发展的亲历者和推动者。金风科技打造的仿真软件“风匠”系统,是一款“更适合中国风资源特征的仿真软件”。依托北京超级云计算中心支持,金风科技以北京超级云计算中心A分区为主资源,进行风资源评估相关的业务生产和产品研发。

为了满足金风科技不同业务部门需求,在计算资源方面,北京超级云计算中心为其提供了独占、包核时等使用方式,同时提供数量和类型丰富的配置资源,这保障其能够通过弹性扩展,有效支撑高峰—平峰使用需求。

“经在A分区的测试和日常生产使用,总体计算性能和速度,有明显提升。”

金风科技相关负责人在用户试用报告中写道:“在技术支持和资源效能方面,基于我方系统需求,提供了多种接入方式和技术支持,并提供了专属的技术支持人员提供资源。在使用A分区资源计算过程中,系统未出现问题。”

提供以独占、包核时的灵活使用模式来满足计算资源需求,除金风科技之外的受益者,还有一长串名字。

这其中就有自然资源部海洋环境科学与数值模拟重点实验室。其首席科学家宋振亚说,A分区计算速度快、节点数量多、通信性能高、并行可扩展性好,而且可通过多种方式使用,高效、便捷。

同时,该实验室以万核规模经过一周以上的不间断运行,系统也没有出现问题,计算数据经过验证,结果正确,“说明该系统运行稳定可靠”。宋振亚说,他们有计划下一步将自主研发的短期气候预测系统也移植到北京超级云计算中心A分区开展业务运行。

中科院院士、中科院物理所研究员向涛团队课题组,是我国在凝聚态物理研究方面的重要力量,他们课题组长期致力于“张量重正化群方法”的发展和应用。而要发展和应用这种方法所需的算力,不仅须满足多核心并行,还要有大的内存支撑。

北京超级云计算中心A分区的计算资源,单节点64核心、内存高达256G,恰能满足向涛院士课题组对计算资源的要求。很快,A分区就成了该课题组科学研究的有力工具。

“我们体会到了省时省力。”

向涛院士课题组研究人员评价说,A分区的存在,简化了计算资源的维护、降低了调试成本,打破了他们一开始对计算资源运维的“心理恐惧”。

上边这3个案例,都是本次榜单上北京超级云计算中心A分区的“光荣事迹”。

前面也有提到,A分区只是北京超级云计算中心的一个主力分区,除A分区外,北京超级云计算中心还有T分区、M分区、IO分区,还有科技云9分区、12分区、15分区、17分区、19分区等等。

为什么要划分这么多分区?

对于超算的需求方而言,他们对超算的需求是多种多样的——有的需要更燃的计算,有的需要更多内存,有的需要更快的数据传输。而所有这些分区,都是因向对计算资源有不同需求的用户提供更便捷高效的服务而存在的。

北京超级云计算中心还在不断动态扩容、不断“分蘖”,也显示了其以用户服务为核心,“将超级云计算服务模式进行到底”的决心。

04

中国超算既要“捅破天” 还要“接地气”

超算是重要的基础工具。没有“神威·太湖之光”、“天河二号”、“曙光星云”等这些大国重器,我们就无法实现尖端科技的突破,无法不断向科学技术广度和深度进军。

但同时也应看到,我国经济社会的进步、各行各业升级发展的需求日益迫切,也在呼唤能够更接地气的海量计算应用,呼唤北京超级云计算中心、阿里云、华为云等一系列能够提供超级算力、提供计算服务、提供大数据处理能力的行业贡献者。

还应指出的是,“计算”作为一种支撑和工具,它还只是先进生产力链条中的一个环节。在计算之外,数据的采集与处理、软件的设计与调优、模型模式的开发等等,需要行业内外更多人的参与。

今天榜单上的所有集群,都只是超算作为硬件形态的一个体现。这一个个的“大家伙”要变成真正的生产力,需要跨越超算硬件与应用之间的“死谷”。

北京超级云计算中心在解决这个问题上想到和实践的方法是“超级云计算服务模式”,但这就够了吗?

美国在超算部署上一直有制定详尽的计划。从国家战略计算计划(著名的NSCI计划),到美国能源部制定实施的百亿亿次计算研发项目(ECP计划),都强调多部门协同、更重视应用。

特别是ECP计划,美国计划5年投入“18亿美元+18亿美元”,一半用于E级计算机研制,一半用于研发应用。

超算行业专家、中山大学数据科学与计算机学院院长钱德沛曾总结中国超算应用上的弱点:缺乏应用软件、缺乏人才、缺乏有效合作。说到底,我们更需要一个完善的“超算用起来”的环境。

无论国家超算、通用超算、行业超算、商业超算,存在形态真的无大所谓,可以兼容并收,但要用起来。只有形成了一个健康的应用生态,中国超算,才算真的顶天立地。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超级计算机
    +关注

    关注

    2

    文章

    460

    浏览量

    41919
收藏 人收藏

    评论

    相关推荐

    ROM对计算机性能的影响

    只读存储器(ROM)是计算机硬件的一个重要组成部分,它负责存储计算机启动时必需的固件和基本输入输出系统(BIOS)。ROM的性能和质量对计算机
    的头像 发表于 11-04 10:31 153次阅读

    芯盾时代荣获2024年中国最佳信创安全厂商

    近日,第一新声联合“天眼查”共同发布了“2024年中国最佳信创厂商”系列榜单。芯盾时代凭借在业务安全领域领先的自主研发能力、诸多突破性的研发成果,以及在信创安全市场的优异表现,继2023后再次成功入选“
    的头像 发表于 10-22 13:48 232次阅读

    云端超级计算机怎么用

    云端超级计算机是一种基于云计算高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 10-18 10:14 102次阅读

    M.2 连接器,满足高性能计算机设备的数据传输需求

    的SATA连接器,M.2 连接器在外形尺寸、传输速度以及兼容性上具备显著优势,满足高性能计算机设备的数据传输需求。 产品特点 体积小巧 产品采用紧凑型设计,相较于传统的SATA连接器体积更小,可有效节省设备空间,适用于各类轻薄型设备。 高速传输 支持
    的头像 发表于 09-23 09:38 260次阅读
    M.2 连接器,满足<b class='flag-5'>高性能计算机</b>设备的数据传输需求

    计算机系统的关键组件有哪些

    计算机系统,关键组件的协同工作构成了其强大的数据处理和运算能力。这些组件不仅决定了计算机性能,还影响着用户的使用体验。以下是对计算机
    的头像 发表于 07-15 18:18 1264次阅读

    内存容量与类型如何影响计算机性能

    内存的容量与类型作为计算机硬件系统的重要组成部分,对计算机的整体性能有着至关重要的影响。它们不仅决定了系统能够同时处理的数据量大小,还影响着程序的运行速度、系统的响应能力以及多任务处
    的头像 发表于 07-15 18:05 1851次阅读

    高性能计算集群的能耗优化

    高性能计算(HighPerformanceComputing,HPC)是指利用大规模并行计算机集群来解决复杂的科学和工程问题的技术。高性能计算
    的头像 发表于 05-25 08:27 372次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群的能耗优化

    高性能计算的原理与实践:从基本概念到架构解析

    高性能计算的概念最早可以追溯到上世纪40代,当时为了进行原子弹的设计和模拟,美国建造了第一台电子数字计算机[ENIAC],它可以每秒执行约5000次运算,相当于当时最快的机械
    的头像 发表于 05-11 08:27 428次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>的原理与实践:从基本概念到架构解析

    Fabless 100榜单出炉:峰岹科技入选微控制器公司Top 10

    Fabless100排行榜单出炉中国IC领袖峰会上AspenCore重磅发布了2024年中国IC设计公司100(ChinaFabless100)排行榜,峰岹科技(股票代码:688279
    的头像 发表于 04-02 08:14 866次阅读
    Fabless 100<b class='flag-5'>榜单</b><b class='flag-5'>出炉</b>:峰岹科技入选微控制器公司Top 10

    【昉·星光 2 高性能RISC-V单板计算机体验】VisionFive2开箱+安装Ubuntu

    【昉·星光 2 高性能RISC-V单板计算机体验】VisionFive2开箱+安装Ubuntu 前言 很感谢赛昉科技及iCeasy提供的样片,让我第一次接触高性能的RISC-V的开发板。 开箱 包装
    发表于 02-21 17:49

    华为第一!2023年中国折叠屏手机报告出炉

    2023年中国折叠屏手机市场出货量同比增速再超100%。
    的头像 发表于 02-21 10:36 942次阅读
    华为第一!2023<b class='flag-5'>年中国</b>折叠屏手机报告<b class='flag-5'>出炉</b>

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高
    的头像 发表于 02-19 13:27 787次阅读
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    2024 CSRankings全球计算机科学排名发布!AI领域中国高校霸榜

    CSRankings 2024结果出炉!全世界计算机科学机构的排名进行了大更新。在AI板块,清华、北大、上交分列TOP 3,CMU和浙大并列第4。AI TOP 10中国高校
    的头像 发表于 01-08 09:28 1273次阅读
    2024 CSRankings全球<b class='flag-5'>计算机</b>科学排名发布!AI领域<b class='flag-5'>中国</b>高校霸榜

    ROM和RAM的主要区别是什么?它们是如何影响计算机性能的?

    计算机性能的影响。 ROM(Read-Only Memory)是只读存储器,顾名思义,它只能被读取,无法被写入或修改。ROM存储的数据在掉电时依然保持不变,因此ROM通常用来存储计算机
    的头像 发表于 12-11 11:42 3528次阅读

    人工智能服务器高性能计算需求

    人工智能(AI)服务器是一种专门为了运行人工智能应用和提供大数据处理能力而设计的高性能计算机。它既可以支持本地应用程序和网页,也可以为云和本地服务器提供复杂的AI模型和服务。
    的头像 发表于 12-08 09:44 481次阅读