0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

日本百亿亿次超算曝光:性能提升100倍,2021年争第一

章鹰观察 来源:新智元 作者:新智元 2018-07-11 11:19 次阅读

日本欲重夺超算第一的行动初见端倪,近日,富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试,研究者称,这台超算的应用性能将是前一代的100倍,达到百亿亿次级,计划在2021年推出。

日本计算机巨头富士通(Fujitsu)和日本最大的研究机构理化学研究所(RIKEN,简称理研)已经开始对下一代超级计算机的原型CPU进行实地测试,他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。

这台下一代超级计算机被称为“Post-K超级计算机”(Post-K supercomputer),是继两家合作机构开发出8 petaflops的“京”超级计算机(K Computer)之后开发的。“京”自2012年开始在理化学研究所内运行,并已经升级到11 petaflops的峰值性能。2014年11月,全部组装完成后的京LINPACK性能达到10 PFLOPS(即每秒1京),创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。

富士通在最近的一份新闻稿中称,他们目标是“创造出世界上最高性能的超级计算机”,“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。

如果他们实现了这一执行速度,那么Post-K超算将进入百亿亿次级别(exascale),1 exaflops表示每秒一佰京/一亿亿亿(1018)次浮点运算。

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU

为此,他们用Arm8A-SVE(可伸缩矢量扩展)512-bit架构取代了京超算的SPARC64 VIIIfx CPU,该架构已被增强为超级计算机使用,富士通和理研都参与了开发。

Post-K超算原型机的CPU package和CPU内存单元

新的设计在CPU上运行,计算节点具有48个核心和2个辅助核心,I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。

出于战略原因,富士通和理研都没有透露Post-K超算的节点总数。但是,位于神户的理研计算科学中心主任松冈聪(Satoshi Matsuoka)说,“这将是世界上最大的Arm系统,事实上,它可能是世界上最大的超级计算机。”

在系统互连方面,富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。

松冈聪表示,除了采用新的CPU之外,Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”,网络带宽也显著增加。

此外,富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说,为了提高应用程序的通用性,它还增加了对半精度浮点运算的支持,这种运算可以减少AI等应用程序的内存负载,在这些应用程序中,低精度是可以接受的。

除了采用Arm指令集架构外,富士通还与英国剑桥的Arm控股公司合作,该公司开发并授权Arm技术,以允许可伸缩矢量扩展实现新的指令。

此外,富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令,但是它没有定义芯片的内部结构。相反,这是微架构的工作,因为它直接影响处理器的性能,富士通认为这将是一个对它有利的重要差异化因素。

理研和富士通在采用新架构时看到了其他一些优势,尤其是设计本身的节能特性,比如电源开关,可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦,而京超算的耗电量为12.7兆瓦,尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。

富士通和理研都表示,它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统,”理研的松冈聪说。他补充说,这将有助于富士通的商业成功,因为“不仅可以向外部公司出售他们的系统,还可以出售芯片”。

与此同时,富士通“将为京超算提供兼容的性能平衡,以便在重新编译后可以迁移当前的应用程序。”

最近,在美国橡树岭国家实验室新安装的超级计算机Summit,使美国重获超级计算机全球排名的榜首位置,这是六年来的首次。根据6月份的Top500榜单,Summit取得了122.3 petaflops的性能,中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。

因此,假如Post-K在2021年前后上线,不过到时,它将发现,争夺领先地位的竞争对手比比皆是。比如,中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功,并且其原型机早已亮相。不过,松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说,Post-K可能表现出最快的解决时间和最大的可扩展性,因为它拥有出色的内存和网络带宽,以及出色的节能设计。”

毫无疑问,不久之后超算领域的竞争对手将会焕然一新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9084

    浏览量

    367373
  • 超级计算机
    +关注

    关注

    2

    文章

    461

    浏览量

    41942
  • 浮点运算
    +关注

    关注

    0

    文章

    19

    浏览量

    11164
  • 富士通
    +关注

    关注

    2

    文章

    194

    浏览量

    54573
收藏 人收藏

    评论

    相关推荐

    日本住友精密工业全面进军MEMS代工业务,目标2030实现百亿日元营收

    企业共同运营的合资公司相关业务。通过整合MEMS设备及制造技术的专业知识,以及母公司住友商事的销售网络等资源, 公司计划切入预计增长迅速的MEMS市场,目标瞄准汽车高性能传感器(LiDAR)及高性能扬声器等领域,到2030实现
    的头像 发表于 11-29 16:27 333次阅读
    <b class='flag-5'>日本</b>住友精密工业全面进军MEMS代工业务,目标2030<b class='flag-5'>年</b>实现<b class='flag-5'>百亿</b>日元营收

    软银升级人工智能计算平台,安装4000颗英伟达Hopper GPU

    达Ampere GPU。通过新增的4000颗Hopper GPU,该平台的总计算性能已跃升至每秒约4.7百亿亿
    的头像 发表于 11-04 16:18 427次阅读

    名单公布!【书籍评测活动NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 力芯片在最近15有着巨大性能突破,这些Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA的GPU产品
    发表于 09-02 10:09

    预定下代第一?富士通144核Arm处理器公开

    电子发烧友网报道(文/周凯扬)相信对市场有过定了解的朋友,都对曾经的第一名富岳不陌生。
    的头像 发表于 06-24 00:26 2752次阅读
    预定下代<b class='flag-5'>超</b><b class='flag-5'>算</b><b class='flag-5'>第一</b>?富士通144核Arm处理器公开

    Flow Computing引领CPU性能革命:PPU技术实现百性能提升

    在科技日新月异的今天,芬兰的家科技初创公司Flow Computing以其革命性的技术突破,再次让全球科技界为之震撼。近日,该公司宣布其研发的并行处理单元(PPU)成功实现了对任何CPU架构性能高达100
    的头像 发表于 06-14 14:34 1206次阅读

    AMD披露高效数据中心策略,预计至2027能效提升

    会议期间,苏姿丰谈论了AMD如何通过实施30x25战略推动2025计算节点能效提升30的目标。她进步透露,AMD已找到2026至20
    的头像 发表于 05-24 17:37 1014次阅读

    最新Top500榜单公布:Frontier再夺魁首,Aurora破百亿大关

    此次Top500排行榜中只有个显著变动:瑞士国家超级计算机中心的Alps凭借270 PFlop/s的Rmax LINPACK FP64力排名上升至第六,超过了IBM POWER
    的头像 发表于 05-14 09:36 812次阅读

    龙芯:自主研发CPU提升性能,单核通用性能提高20

    张戈强调,龙芯CPU的主要IP核均为自主研发,这使得其性价比得到显著提升。他指出,国产CPU与主流CPU的差距主要体现在单核性能上,而非多核性能。近年来,龙芯CPU的单核通用性能
    的头像 发表于 04-25 15:26 792次阅读

    “捷智”正式入驻国家互联网平台

    ABSTRACT摘要20244月2日,本公司旗下力服务品牌“捷智”正式入驻国家互联网平台,开设云gpu旗舰店。我们将借助国家
    的头像 发表于 04-12 08:26 565次阅读
    “捷智<b class='flag-5'>算</b>”正式入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    千亿美元打造个系统,成本越来越高的AI

    电子发烧友网报道(文/周凯扬)从近年来新发布的算机器和新的HPC AI性能榜单可以看出,AI力已经在中成了不可忽视的
    的头像 发表于 04-09 00:19 3045次阅读

    英特尔或可以拿到百亿美元补贴

    英特尔或可以拿到百亿美元补贴 据彭博社的爆料,美国为引导半导体制造业的回归,目前正在就向英特尔公司提供超过100亿美元(换算下来约人民币711.94
    的头像 发表于 02-18 11:19 650次阅读

    智能力规模通用力,大模型对智能力提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   力可以分为通用力、智能力和算算力。早前通用力占整体
    的头像 发表于 02-06 00:08 6308次阅读

    长沙中心算力重归国际流水平 同时湖南公布2024十大产业项目

    显示,在2023,湖南100个数字新基建标志性项目加快推进,中国电信中南智能力中心投产运营,人工智能力达1200PF,长沙
    的头像 发表于 01-25 16:04 2073次阅读

    欧盟首台百亿亿次级超级计算机JUPITER建设成果显著,进入新阶段

    欧洲超级计算机联盟 EuroHPC JU 曾于 2023 10 月宣布,将投资 2.73 亿欧元打造欧洲第一台超大规模超级计算机——JUPITER,预期其性能将达到每秒五亿
    的头像 发表于 01-25 14:40 618次阅读

    新能源车第一股预亏52亿累计亏200亿

    新能源车第一股预亏52亿累计亏200亿 新能源汽车
    的头像 发表于 01-16 19:25 724次阅读