0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

独家解读NVIDIA CUDA支持Arm——百万兆级超算竞争再加剧?

张慧娟 来源:电子发烧友网 作者:张慧娟 2019-06-18 03:19 次阅读

在法兰克福举办的全球超级计算大会上,重磅消息传来,NVIDIA宣布CUDA支持Arm CPU,为高性能计算开辟全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。北京时间6月17日下午四点,NVIDIA与媒体召开电话会议。下文将详解双方合作始末,以及<电子发烧友>独家求证后获知的信息

NVIDIA携手Arm意欲何在?

随着传统计算规模扩展步伐的停止,功率将成为所有超级计算机的限制因素。对于与Arm的携手,NVIDIA创始人兼首席执行官黄仁勋表示:“NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百万兆级。”

双方合作的原因主要有两方面:首先,客户需要更多选择,一旦完成堆栈优化,Nvidia将加速所有主要CPU架构,包括x86、Power和ARM;其次,通过将NVIDIA软件栈引入Arm生态系统,将进一步助推在HPC服务器市场的创新。

年底前,NVIDIA将向Arm生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

NVIDIA解决方案架构与工程团队副总裁Marc Hamilton透露,NVIDIA和Arm已为这个计划准备了两年左右,认为现在是最佳的发布时机。建立在双方超过10年的合作基础之上,此前,NVIDIA几款用于便携式游戏、自动驾驶汽车、机器人嵌入式AI计算的系统级芯片产品都采用了Arm。全球众多涉及超级计算的项目或单位都在寻求Arm的加入,包括欧洲处理器计划(European Processor Initiative)、日本先进情报项目中心 (RIKEN)、美国能源部的先锋项目(DOE Vanguard project)等。

合作仅止于HPC软件方面?还是会进一步影响到某些应用市场?NVIDIA表示,合作同时也是对于其他平台的补充,例如Jetson Xavier,并将进一步拓展在数据中心和HPC平台的合作。

超算竞争再加剧

在超级计算机中使用基于Arm的体系结构是值得注意的,和其他架构相比,Arm的一大特色在于出色的能效,能够为超级计算提供开放式架构,用户可以实现更为高度的集成。对于需要快速处理和分析大型数据集的研究密集型任务,能够满足内存容量和可扩展性需求。

Arm已经在世界各地的许多HPC中心获得了越来越多的关注,NVIDIA支持Arm CPU后,将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择,并使得研发者可以通过这种方式获得更多的自主控制能力。对于已经选择了Arm CPU的用户来说,他们同时可以获得NVIDIA GPU加速计算选项。CUDA强大的软件能力,将能够和Arm的软件生态无缝衔接,强强联合。

一直以来,Arm并没有放弃将其处理器扩展至高性能计算领域的坚持。近年来大的举动有:2016年8月宣布将与日本富士通公司合作,开发一个以64位ARMv8-A驱动的Post K超级计算机,并于当年12月宣布收购Allinea Software公司,后者主要为超级计算机提供性能分析工具。在2018年11月的TOP500列表上,首次出现了Arm的身影,而且是安装在大名鼎鼎的美国桑迪亚国家实验室。与此同时,Cray于2018年11月在英国气象局交付了一台基于Arm的超级计算机"Isambard",而日本的下一代超级计算机"Post-K"也同样基于Arm架构。

超算未来将更为注重能耗

超算届有两个重要排名:TOP500和Green500。TOP500主要按照性能基准,提供通用高端应用的系统排名。而相比TOP500,Green500除了追求运算速度,更加重视超算的能耗问题。

根据今年刚刚发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。关键因素在于:采用NVIDIA GPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上;NVIDIA与Mellanox合作优化整体超级计算集群的处理;以及NVIDIA发明的SXM 3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技术。

携手打造超豪华“朋友圈”

包括超算中心和系统提供商以及系统级芯片制造商等在内的众多HPC行业及Arm生态系统中的全球领先企业,都表达了其对于NVIDIA携手Arm的支持。

对于超算百万兆级时代的愿景,Cray认为主要在于将AI和分析与建模、仿真相结合的系统,这些系统能够支持、也经常需要为科学、工程和数字化转型所需的数据密集型工作负载构建的多种处理器架构和系统。Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持Arm处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台,并将其与Cray系统管理和编程环境紧密集成,能够助力其超级计算机实现最终愿景。

“欧洲处理器计划(European Processor Initiative,EPI)总经理Philippe Notton则表示,打造欧盟自己的高端、低功耗、通用和加速器解决方案,EPI和其工业合作伙伴SiPearl非常看好NVIDIA所带来的全新可能性。将EPI基于Arm的微处理器与NVIDIA加速器相结合,能够匹配未来欧洲百万兆级模块化超级计算机中的构建模块。”

考虑到未来几年内百万兆级系统和大规模AI计算的兴起,Jülich超算中心负责人Thomas Lippert表示, NVIDIA对Arm处理器的支持是非常令人兴奋的发展,对于实现未来超级计算机和可组合数据中心的真正模块化至关重要。

在HPC网络方面处于领先地位的Mellanox Technologies,其InfiniBand和以太网技术连接了全球多款大型的超级计算机,其中就包括第一代基于Arm的各系统。该公司创始人兼首席执行官Eyal Waldman希望通过持续合作,部署200Gb/s HDR和计算网络技术,以优化HPC和AI工作负载,并实现新一代基于Arm的超级计算机的超级连接。

百万兆级意义何在?

全球超级计算机竞赛正朝着“百万兆级计算”这个里程碑似的目标前进着。

百万兆级意味着什么?一个百万兆级的计算机一瞬间进行的计算量,相当于地球上所有人每天每秒都不停地计算四年。

这种非凡的力量将使研究人员能够进行大规模复杂的模拟,从而在许多领域取得进展,从气候科学到基因组学、可再生能源和人工智能。田纳西大学的超级计算机专家Jack Dongarra曾说过:“百万兆级的计算机是一项有力的科学工具,就像粒子对撞机或巨型望远镜一样。”这些机器在工业上也很有用,它们可以被用于加速产品设计和识别新材料。军方和情报机构也渴望这样的超级计算机能够将被用于维护国家安全。超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9027

    浏览量

    366432
  • NVIDIA
    +关注

    关注

    14

    文章

    4847

    浏览量

    102702
  • 超级计算
    +关注

    关注

    1

    文章

    38

    浏览量

    11224
  • HPC
    HPC
    +关注

    关注

    0

    文章

    309

    浏览量

    23646
  • CUDA
    +关注

    关注

    0

    文章

    121

    浏览量

    13585
收藏 人收藏

    评论

    相关推荐

    iQOO 13首发电竞芯片Q2,独家支持2K分辨率

    10月23日,iQOO正式揭晓,其最新款iQOO 13将独家首发自研电竞芯片Q2,此举突破了电竞视效的极限,树立了新的行业标杆。   凭借Q2芯片的卓越性能,iQOO 13实现了行业前所未有的2K 144FPS帧并发
    的头像 发表于 10-24 11:43 402次阅读

    预定下代第一?富士通144核Arm处理器公开

    电子发烧友网报道(文/周凯扬)相信对市场有过一定了解的朋友,都对曾经的第一名富岳不陌生。这台2021年正式启用的
    的头像 发表于 06-24 00:26 2663次阅读
    预定下代<b class='flag-5'>超</b><b class='flag-5'>算</b>第一?富士通144核<b class='flag-5'>Arm</b>处理器公开

    鸿海再获AI领域大单,独家供货英伟达GB200 NVLink交换器

    在人工智能(AI)领域的激烈竞争中,鸿海集团再次传来捷报。继成功获得英伟达(NVIDIA)GB200 AI服务器代工订单的大份额后,鸿海又独家揽获了GB200关键元件——被誉为“提升
    的头像 发表于 06-19 15:04 918次阅读

    NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

    Enterprise-IGX软件现已在NVIDIA IGX平台上正式可用,以满足工业边缘对实时 AI 计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业软件和支持来加快开发
    的头像 发表于 06-04 10:21 445次阅读

    QPU与GPU,经典和量子计算的协同

    电子发烧友网报道(文/李宁远)不久前在国际大会ISC上, NVIDIA宣布将通过开源的 NVIDIA CUDA-Q量子计算平台,助力全球
    的头像 发表于 05-21 01:35 2393次阅读

    英伟达CUDA-Q平台推动全球量子计算研究

    与经典的深度整合。该平台的重要特性在于其支持量子计算与AI人工智能的完美结合,为解决量子比特噪声问题提供了新思路,并有助于开发出更加高效的算法。
    的头像 发表于 05-14 11:45 602次阅读

    最新Top500榜单公布:Frontier再夺魁首,Aurora破百亿大关

    此次Top500排行榜中只有一个显著变动:瑞士国家超级计算机中心的Alps凭借270 PFlop/s的Rmax LINPACK FP64力排名上升至第六,超过了IBM POWER9处理器和
    的头像 发表于 05-14 09:36 734次阅读

    NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

    —— NVIDIA 于今日宣布将通过开源的 NVIDIA CUDA-Q™ 量子计算平台,助力全球各地的国家
    发表于 05-13 15:21 180次阅读
    <b class='flag-5'>NVIDIA</b> 通过 <b class='flag-5'>CUDA</b>-Q 平台为全球各地的量子计算中心提供加速

    宁德时代、比亚迪正向新能源车细分领域探索,推进百万车型电动化

    宁德时代和比亚迪正默契地向新能源车细分领域探索,越野、跑等百万车型的高端市场逐渐成为他们提高市占率的新“战场”。
    的头像 发表于 04-19 10:39 912次阅读

    “捷智”正式入驻国家互联网平台

    ABSTRACT摘要2024年4月2日,本公司旗下力服务品牌“捷智”正式入驻国家互联网平台,开设云gpu旗舰店。我们将借助国家
    的头像 发表于 04-12 08:26 446次阅读
    “捷智<b class='flag-5'>算</b>”正式入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    深度解读Nvidia AI芯片路线图

    Nvidia是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C技术将CPU、GPU进行灵活连接组合形成统一的硬件架构,并于CUDA一起形成完整的软硬件
    发表于 03-13 09:25 791次阅读
    深度<b class='flag-5'>解读</b><b class='flag-5'>Nvidia</b> AI芯片路线图

    国产ARM建设历程 Arm计算在领域的实践

    ARM 指令集兼容架构已成为HPC 主流技术与未来发展的重要趋势,可满足大型系统与商用HPC 系统的技术需求。
    的头像 发表于 01-25 14:06 1172次阅读
    国产<b class='flag-5'>ARM</b><b class='flag-5'>超</b><b class='flag-5'>算</b>建设历程 <b class='flag-5'>Arm</b>计算在<b class='flag-5'>超</b><b class='flag-5'>算</b>领域的实践

    什么是CUDA?谁能打破CUDA的护城河?

    在最近的一场“AI Everywhere”发布会上,Intel的CEO Pat Gelsinger炮轰NvidiaCUDA生态护城河并不深,而且已经成为行业的众矢之的。
    的头像 发表于 12-28 10:26 1.2w次阅读
    什么是<b class='flag-5'>CUDA</b>?谁能打破<b class='flag-5'>CUDA</b>的护城河?

    OpenCV4.8 CUDA编程代码教程

    OpenCV4支持通过GPU实现CUDA加速执行,实现对OpenCV图像处理程序的加速运行,当前支持加速的模块包括如下。
    的头像 发表于 12-05 09:56 945次阅读
    OpenCV4.8 <b class='flag-5'>CUDA</b>编程代码教程

    OpenCV4.8+CUDA+扩展模块支持编译指南

    OpenCV4.8+CUDA+扩展模块支持编译指南
    的头像 发表于 11-30 16:45 868次阅读
    OpenCV4.8+<b class='flag-5'>CUDA</b>+扩展模块<b class='flag-5'>支持</b>编译指南