0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超级计算机的异构分歧

E4Life 来源:电子发烧友网 作者:周凯扬 2022-05-10 00:27 次阅读

电子发烧友网报道(文/周凯扬)转眼接近六月,离新一期TOP500超算排名公布的日子又不远了。这半年多时间里,业界在超算上的动作可不小,新的处理器、新的加速器都在积极加入各大超算中心、国家实验室的大规模部署。国内的百亿亿级超算系统目前还没有提交成绩,不过这已经不重要了,这场谁先做到百亿亿级的竞赛中国已经取胜了,更不用说去年就通过新一代神威超算打破了量子霸权。

不过近期有一种观点开始冒头,那就是超算的规模已经越来越大,结构也越来越复杂,未来除了CPUGPU之外,FPGAAI加速器、量子加速器、神经形态芯片和硅光芯片等设备是否会在超算上占据更大的份额呢?在这样的异构体系下,超算是否会像其他大型仪器,比如大型粒子对撞机、平方公里阵列射电望远镜一样,逐一替换部件呢?

开始异构化的超算

尽管FPGA已经经历了多年的应用,但在HPC上亮相的次数可谓少之又少,这并非是缺乏尝试,而是传统FPGA硬件上存在限制,开发工具也相对特化,对于尝试数据科学的开发者来说上手难度较高。

VersalHBM /Xilinx


然而近年来,在各大FPGA厂商的努力下,FPGA已经有了长足的发展,其性能足以支撑起HPC应用的运行,FPGA编程也终于有了软件开发而不是硬件设计的样子。英国的ExCALIBUR项目就开始利用FPGA作为HPC应用的测试平台,所用硬件有Xilinx的Alveo、Versal,也有英特尔的Stratix-10。

神经形态芯片也想要取代GPU的位置,美国桑迪亚国家实验室就利用了5000万片英特尔的Loihi神经形态芯片进行了研究,证明了这类芯片不仅仅适用于解决AI上的挑战,在分子模拟、生物学建模这些超算应用也能做到极高的能效比。

即便如此,我们在TOP500上看到利用新硬件的情况还是很少,英特尔、AMD英伟达还是占据了绝对的主导。

实际应用与软件移植的痛点

但说到头来,TOP500所奉行的HPL测试标准并不是衡量超算性能的唯一标准,还有专注于带宽的HPCG,以及更看重时延的Graph500。异构超算可以借助不同硬件的特性,将这些痛点各个击破。

富岳超级计算机 / 日本理化学研究所


日本富岳超算的主要贡献者之一,前不久刚获得了日本政府所颁发紫绶褒章的松冈聪却对超算上的异构趋势表示了一定的怀疑。他认为未来的HPC系统不会由各种类型的设备组成,反倒是会更加慎重地选择所用的处理器,从而兼顾计算、带宽和时延的需求。

原因很简单,那就是软件生态。如今的HPC代码运行着世界上最复杂的应用,比如气象预测、大规模数字孪生等等。但这类应用由于复杂程度之高,承担不起因为当前的硬件架构几年内过时而面临着重新编程或淘汰的代价,这也就是为何CPU+GPU的配置在超算领域依旧是龙头老大,因为这种架构下的超算软件生态已经成熟,可以沿用下去。

就拿常见的超算编程语言Fortran为例,虽说这一语言在数学运算上有着很大的优势,但由于维护和移植困难,不少开发者都转向了C/C++,而GPU又多用C++,所以即便现在各种加速器频出,率先使用他们的也只是数据中心或AI等场景,并非超算。

但松冈聪也表示,他并不是指这些设备无法运行这些代码,或者移植困难不代表没有尝试的价值,而是即便代码可以运行在这些设备上,也很难通过负载均衡来践行古斯塔夫森定律,即处理器数量增加可以让程序运行时间减少,最好的解决思路还是CPU或CPU+GPU这种同构的方案。

虽然其他硬件加入的异构确实对不同的工作流各个攻破,但超算很多时候是建好就完事的计算系统,后续也许只能增加同样的计算资源来提高硬件性能,设计者无法预先判断未来要运行的任务,因此追求这样的灵活性还不如使用同构这一通解。

在使用超算的研究者和科学家看来,他们在一台超算上力求取得最大性能就已经付出了巨大的心力,要是超算内真的囊括一堆不同架构的设备,单是庞大的编程和移植工作量就足以让他们丧失兴趣。他们或许更愿意去优化算法或理论,都不愿意因为架构的变化而去花费大量时间编程。

云化超算成为可行方案?

还有一种观点也获得了不少支持,那就是云化超算。云服务厂商在HPC上的努力也都有目共睹,去年超算大会上,国内外大学之间的比赛也是在云服务上构筑超算系统,TOP500上来自云服务厂商的超算也有几台,微软的Azure就有5台,最强的一台Voyager-EUS2甚至排到了第十的高位。

虽然云端部署超算的成本同样巨大,但对于一些实验室来说,云端的模块化特性让他们不用担心自己用不到什么组件,花更少的时间来购置超级计算机,花更多的时间去使用它。比如英国政府就选择在微软的Azure上部署慧与的CrayEX超算,用其完成气象预测工作。更方便的是,由于超算消耗电力巨大,基础设施可以托管在北欧等清洁能源更多的地方。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19404

    浏览量

    230981
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10901

    浏览量

    212814
  • 超级计算机
    +关注

    关注

    2

    文章

    464

    浏览量

    41998
收藏 人收藏

    评论

    相关推荐

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 12-17 10:19 182次阅读

    量子计算机与普通计算机工作原理的区别

    超越世界上最强大的超级计算机,完成以前不可想象的任务!这意味着量子计算机可能会彻底改变我们的生活。 在本文中,我们将先了解普通计算机的工作原理,再深入探讨量子
    的头像 发表于 11-24 11:00 466次阅读
    量子<b class='flag-5'>计算机</b>与普通<b class='flag-5'>计算机</b>工作原理的区别

    丹麦推出首台AI超级计算机Gefion

    近日,丹麦正式推出了该国首台人工智能超级计算机,命名为Gefion,以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席,彰显了该项目的重要性和影响力。 Gefion AI
    的头像 发表于 10-29 15:13 454次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 499次阅读

    云端超级计算机怎么用

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 10-18 10:14 203次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 573次阅读

    异构计算:解锁算力潜能的新途径

    在这个数据爆炸的时代,计算力是推动社会与科技创新的核心。从日常智能设备的流畅运行到超级计算机的尖端模拟,均依赖强大的计算能力。但面对多样化的复杂计算
    的头像 发表于 07-18 08:28 9303次阅读
    <b class='flag-5'>异构计算</b>:解锁算力潜能的新途径

    工业计算机与普通计算机的区别

    在信息化和自动化日益发展的今天,计算机已经成为了我们日常生活和工作中不可或缺的工具。然而,在计算机领域中,工业计算机和普通计算机虽然都具备基本的计算
    的头像 发表于 06-06 16:45 1583次阅读

    马斯克计划打造超级计算机推动AI发展

    科技巨头埃隆·马斯克近日在投资者会议上透露,其人工智能初创公司xAI正全力筹备打造一台超级计算机。这台计算机将作为下一版人工智能聊天机器人Grok的强大后盾,为其提供强大的算力支持。
    的头像 发表于 05-28 09:18 571次阅读

    富士通使用富岳超级计算机训练LLM

    尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器,但它仍然是一个非常强大的系统,A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。
    的头像 发表于 05-13 14:18 589次阅读

    英伟达帮助日本建造混合量子超级计算机

    英伟达正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 593次阅读

    微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机

    微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机这一消息属实。
    的头像 发表于 04-11 10:14 665次阅读

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 470次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的诺和诺德基金会携手英伟
    的头像 发表于 03-21 13:43 654次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》一书,感谢电子发烧友论坛提供了一个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子计算机真是一无所知,只是听说过量子纠缠、超快的运算速
    发表于 03-05 17:37