0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zettascale仍是妄想?HPC不得不面对的成本问题

基于树莓派的自动驾驶 来源:电子发烧友网 作者:周凯扬 2023-05-19 00:32 次阅读

电子发烧友网报道(文/周凯扬)要说HPC对更高算力等级的追求,往往在很长一段时间之前就开始了,比如最近才开始冒头的Exascale超算,其实也是从2007年左右才开始规划的,直到去年才有了Frontier的出现,以及将在今年上线的Aurora和El Captitan超算。其中经历了不少阻碍,比如处理器的设计问题、供应链的短缺加上正式上线前持续的优化等。

然而,在达成了一个目标后,我们就会忍不住去设想下一个目标,Zettascale到底离我们有多远?到了现在我们也都知道,肯定不会像Intel前图形部门负责人Raja Koduri说的那样,在2027年左右实现。可我们也都知道现在是一个算力指数增长的时代,为何真正的Zettascale系统却还要那么久才能出现呢?除了技术演进外,自然就是成本问题。

规模硬件成本

首先考虑到的就是规模成本,目前的Exascale级别系统中,拥有成千上万个节点已经不是什么稀奇事了,而作为Exascale千倍的Zettascale系统,除非通用算力有了飞跃式的提升,不然这样的规模化部署即便是大型云服务厂商或国家实验室都难以负担。

就已上面提到的Frontier为例,这台超算由9472块AMD Epyc 7453 CPU和37888块Radeon Instinct MI250X GPU组成,单是硬件成本就达到了6亿美元左右。同样,如此庞大规模的系统在运营规模上也不可小觑,根据超算实验室负责人透露,在这类机器上运行应用程序两周的成本大概在700万美元。

以上还只是规模化的计算硬件成本,每一个超算系统还要考虑到规模化的电源、冷却和线缆带来的成本。如果节点数量翻倍的话,以上附加硬件费用也都要统统翻倍,甚至可能会指数级上涨。

至于可用的规模化量子计算超算,解决药物代谢之类的复杂科学问题,那需要的物理量子位可能要在千万级以上,总的硬件成本范围大概在50亿美元和200亿美元之间。可以说,如果无法把这个成本降下几个数量级,那么为HPC付出的成本代价势必会令所有人退却。

设计成本

要想及时进入Zettascale时代,直接购买第三方供应的处理器必然是最省事的,但对比近来几个超算系统的部署进度,供应商不一定能保证按时交付,有太多因素会影响到原本的部署计划。而且这种方式因为其通用性缺失省了不少麻烦,却不一定省钱。那么自研处理器是否会是更加省钱的方法呢?

以日本的富岳超算为例,虽然该系统整个项目的成本达到了10亿美元,但其中包括了A64FX这一ARM CPU的设计与硬件成本。更不用说同样的架构未来可以用于打造下一代超算系统。而不需要购买时下昂贵的第三方处理器。

拥有同样想法的还有印度政府,他们为国内超算系统打造的AUM处理器同样采用了ARM架构,甚至由于采用了96核的Arm Neoverse V1设计,并采用了台积电的5nm工艺,在性能上甚至要高于A64FX。

可由于采用了先进工艺,其设计成本本身就很难降低下来,以目前的市价来看,台积电N5节点的设计成本大概在5亿美元,所以如果不是真的打算把自研一直走下去,这种方法反而是最费钱的一种。

小结

我们是靠吃到了工艺、设计双双爆发的红利,才能以这么快的速度进入了Exascale时代,至于64位下的Zettascale系统,我们很可能还是要等到2035年才能得见真容。但这并不代表我们不能从现在开始准备,虽然离部署还很遥远,但对各大处理器和架构的评估,其实早就在各大研究机构中开展了。尤其是随着AI负载的加入,任何HPC系统都必须决定未来通用计算与AI计算各自的占比,并研究专为AI打造的一套全新HPC应用程序。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HPC
    HPC
    +关注

    关注

    0

    文章

    318

    浏览量

    23813
收藏 人收藏

    评论

    相关推荐

    云计算和HPC的关系

    尽管云计算和HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算和HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云计算和HPC的关系。
    的头像 发表于 12-14 10:35 131次阅读

    errDump错误日志上报:开启高效排查之门

    相信很多朋友都会忽视errDump错误日志上报,但不得不说的是技术高手都知道它真的是比较重要的一环。
    的头像 发表于 11-02 11:52 351次阅读
    errDump错误日志上报:开启高效排查之门

    HPC云计算前景

    高性能计算(HPC)与云计算的结合,正逐步成为推动科技创新和产业升级的重要引擎。随着数据规模的不断扩大和计算需求的日益复杂,HPC云计算展现出了巨大的潜力和价值。
    的头像 发表于 10-16 10:17 249次阅读

    英伟达面临双重反垄断调查挑战

    英伟达,这家在人工智能芯片领域占据领先地位的科技公司,近期遭遇了前所未有的挑战。在享受了数月由AI芯片需求激增带来的股价暴涨和市场乐观情绪后,英伟达不得不面对来自监管机构的双重反垄断调查。
    的头像 发表于 08-14 11:45 602次阅读

    拒绝渗漏,安全、快速、有效的治理变压器渗漏油

    电厂变压器渗漏油,用这种技术治理立竿见影,不得不称赞!
    的头像 发表于 07-25 10:45 323次阅读
    拒绝渗漏,安全、快速、有效的治理变压器渗漏油

    精密空调—不得不服的精密空调"黑科技"!逆天了#精密空调

    精密空调
    北京汇智天源
    发布于 :2024年07月20日 12:33:01

    不得不爱的保护装置-安全就这么简单

    保护装置
    jf_18500570
    发布于 :2024年07月01日 10:20:02

    3倍ROI,腾讯云卷出一个降本增效神器

    区。特别是在后疫情时代,竞争的激烈让每一个身处其中的企业,都不得不节约每一发“子弹”。当IT成本开始逐年走高,成为企业的重要支出时,如何有效降本就成了决策者不得不面对
    的头像 发表于 06-19 08:05 139次阅读
    3倍ROI,腾讯云卷出一个降本增效神器

    5v1.2a电源芯片U95123省心又省钱

    随着商业模式和市场策略的不断调整,许多客户不得不开始寻求更加实用、经济的电源芯片解决方案。
    的头像 发表于 04-17 17:18 1105次阅读

    特斯拉裁员背后原因 特斯拉最少裁员1.4万人

    特斯拉近日掀起了一场裁员风暴,计划裁员比例高达10%,这一消息瞬间引发了业界的广泛关注。特斯拉的员工们也不得不面对职场上的巨变。
    的头像 发表于 04-16 14:50 586次阅读

    关于MCU选型不得不知的学问

    MCU选得好不好,往往决定着产品和商业OK不OK。 这个质量,可能是芯片抗干扰强不强?能不能过产品认证? 也可能是在某一温度能否稳定运行? 还有可能是有些应用外设有没有坑?
    的头像 发表于 04-15 10:16 456次阅读

    美方持续收紧AI芯片对华出口限制,英伟达等巨头面临挑战

    为了挽回中国市场,英伟达不得不做出妥协,推出了符合美方限制政策的A100和A800芯片。
    的头像 发表于 04-02 16:28 1240次阅读

    计算机最核心的——CPU

    在CPU的四个结构中,寄存器的重要性远远高于其余三个,为什么这么说?因为程序通常是把寄存器作为对象来进行描述的。而说到寄存器,就不得不说到汇编语言,说到汇编语言,就不得不说到高级语言,说起高级语言也就不得不提及语言的概念。
    发表于 03-13 14:04 2021次阅读
    计算机最核心的——CPU

    企业组网如何兼顾低成本与高性能?

    在数字化浪潮席卷全球的今天,企业的网络需求变得愈加复杂和多样化。面对激烈的市场竞争,企业不得不寻求一种既能降低成本又能保证高性能的网络解决方案。传统组网方式虽然稳定可靠,但昂贵的硬件投入和升级
    的头像 发表于 02-26 14:59 410次阅读

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高计算效率和处理能力,实现对大量
    的头像 发表于 02-19 13:27 888次阅读
    什么是<b class='flag-5'>HPC</b>高性能计算