0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SC23 | 新型加速节能 AI 系统开创超级计算的新时代

NVIDIA英伟达 来源:未知 2023-11-15 18:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式 AI 和 HPC 来应对科学和工业领域的重大挑战。

11 月 13 日,NVIDIA 在 SC23 上发布了一系列新技术,将全球各地的科学和工业研究中心推向性能和能效新高。

NVIDIA 高性能计算和超大规模数据中心业务副总裁 Ian Buck 在 SC 大会发表的特别演讲中提到:“NVIDIA 的硬件和软件创新正在创造一种新型 AI 超级计算机。”

其中一些超级计算机将配备内存增强的 NVIDIA Hopper 加速器,另一些则采用全新 NVIDIA Grace Hopper 系统架构。它们都将使用扩展的并行结构来运行面向生成式 AI 、HPC 和混合量子计算的全栈加速软件。

Buck 将全新 NVIDIA HGX H200 称为“世界领先的 AI 计算平台”。

它配备高达 141 GB 的 HBM3e,是首款使用这项超快技术的 AI 加速器。在运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的性能比上一代加速器高出 18 倍。

wKgZomVUolyAb7tRAAF9ECI1Zks126.png

NVIDIA H200 Tensor Core GPU 配备HBM3e 内存,

可运行不断增长的生成式 AI 模型

在其他生成式AI基准测试中,它们在一个 Llama2-13B 大语言模型(LLM)上每秒可快速通过 12,000 个 token 。

Buck 还展示了一个服务器平台,该平台在一个 NVIDIA NVLink 互联下连接了四个 NVIDIA GH200 Grace Hopper 超级芯片。这一四组芯片的配置使得在一个计算节点内有高达 288 个 Arm Neoverse 核心,以及 2.3 TB 的高速内存 ,实现了 16 petaflops 的 AI 性能。

wKgZomVUolyAYUweAAFdB4NWpNE304.png

基于四个 GH200 超级芯片的服务器节点,提供 16 petaflops 的 AI 性能

采用 NVIDIA TensorRT-LLM 开源库的单个 GH200 超级芯片比一个双插槽 x86 CPU 系统快 100 倍,比一台 x86 + H100 GPU 服务器节能近 2 倍,展现了卓越的节能效果。

Buck 说:“加速计算是可持续的计算。通过充分利用加速计算和生成式 AI,我们可以推动各行各业的创新,同时减少对环境的影响。”

新上榜 TOP500 的 49 个系统中

有 38 个采用了 NVIDIA 技术

最新发布的全球最快的超级计算机 TOP500 榜单显示,人们正在转向加速、节能的超级计算。

由于诸多新建超级计算机采用了 NVIDIA H100 Tensor Core GPU,NVIDIA 目前在这些世界领先的系统中提供超过 2.5 exaflops 的 HPC 性能,相较此前 5 月榜单中的 1.6 exaflops 有了不少提升。仅在全球超级计算机 Top 10 中,NVIDIA 就提供近 1 exaflop 的 HPC 性能和 72 exaflops 的 AI 性能。

在新榜单中,采用 NVIDIA 技术的超级计算机数量再创新高,从 5 月份的 372 个增加到 379 个,其中包括 49 个新上榜超级计算机中的 38 个。

部署在 Microsoft Azure 中的 Eagle 系统是算力最高的新上榜超级计算机,其采用 H100 GPU,在 NDv5 实例中以 561 petaflops 的算力在总榜中排名第三。巴塞罗那的 Mare Nostrum5 排名第 8 ,而最近在 MLPerf 基准测试中创下 AI 训练新纪录的 NVIDIA Eos 排名第 9 。

在 Green500 的前 30 名中有 23 个采用了 NVIDIA GPU ,彰显了它们的节能优势。配备 H100 GPU 的 Henri 系统蝉联第一,它位于纽约 Flatiron 研究所,能效为每瓦 65.09 gigaflops 。

使用生成式 AI 探索新冠病毒

美国阿贡国家实验室展现了无限可能,它使用 NVIDIA BioNeMo(一个面向生物分子大语言模型的生成式 AI 平台)开发了 GenSLM 模型。这个模型可以生成与冠状病毒的现实变种非常相似的基因序列。使用 NVIDIA GPU 以及来自 150 万个新冠病毒基因组序列的数据,它还可以快速识别出新的病毒变种。

这项工作去年获得了戈登·贝尔特别奖,并在包括美国阿贡国家实验室的 Polaris 系统、美国能源部的 Perlmutter 和 NVIDIA 的 Selene 在内的超级计算机上进行了训练。

NVIDIA 医疗业务副总裁 Kimberly Powell 在此次特别演讲中提到:“这只是冰山一角。随着生成式 AI 不断重新定义科学探索,未来充满了无限可能。”

节约时间、金钱和能源

Buck 提到,使用最新技术为工作负载加速可以将系统的成本和能耗降低一个数量级。

例如,西门子与梅赛德斯合作为新其款 EQE 电动汽车分析空气动力学和相关声学。这类模拟此前在 CPU 集群上通常耗时数周时间,而借助最新的 NVIDIA H100 GPU ,其速度要快很多。此外,Hopper GPU 使成本降低了 3 倍,能耗降低了 4 倍(如下如所示)。

wKgZomVUolyAD4GCAADNSTe1028207.png

明年将开启 200 Exaflops 时代

在全球各地,部署这些最新系统将推动科学和工业领域不断取得进步。

Buck 说:“我们已经看到,2024 年将有基于 Grace Hopper 超级计算机的总计 200 exaflopsAI 算力投入生产。”

其中包括德国于希利研究中心的大型 JUPITER 超级计算机。它可以为 AI 训练提供 93 exaflops 的性能,为 HPC 应用提供 1 exaflop 的性能,而能耗仅为 18.2 兆瓦。

wKgZomVUolyAU-OZAACpjCa0koM282.png

GH200 为研究中心带来性能飙升

基于 Eviden 的 BullSequana XH3000 液冷系统,JUPITER 将使用 NVIDIA quad GH200 系统架构和 NVIDIA Quantum-2 InfiniBand 网络,用于进行气候和天气预测、药物发现、混合量子计算和数字孪生。JUPITER 所采用的 quad GH200 节点将配置 864 GB 的高速内存。

这是 NVIDIA 在 SC23 上宣布的数个使用 Grace Hopper 的新型超级计算机之一。

慧与(Hewlett Packard Enterprise)的 HPE Cray EX2500 系统将为明年投入使用的众多AI超级计算机配备 quad GH200。

例如,慧与建设的 OFP-II(一个由日本筑波大学和东京大学共享的先进 HPC 系统)以及 DeltaAI 系统(将使美国国家超级计算应用中心的算力提升三倍)均将采用 quad GH200。

HPE 正在为美国洛斯阿拉莫斯国家实验室建造 Venado 系统,这是在美国部署的首个 GH200,其还将在中东、瑞士和英国建设更多 GH200 超级计算机。

德克萨斯及更多地区采用 Grace Hopper

在德克萨斯高级计算中心(TACC),戴尔科技集团正在使用 NVIDIA Grace Hopper 和 Grace CPU 超级芯片建造 Vista 超级计算机。

Buck 表示,包括美国航空航天局艾姆斯研究中心(NASA Ames Research Center)和 Total Energies 在内的全球 100 多个企业和组织已经采购了 Grace Hopper 早期访问系统。

此前已宣布采用 GH200 的用户包括软银和布里斯托大学,以及配备 14000 个 NVIDIA A100 GPU 的大型 Leonardo 系统,后者为意大利 Cineca 联盟提供 10 exaflops 的 AI 性能。

超算中心的观点

来自世界各地超算中心的主管介绍了他们采用最新系统的计划及进展。

瑞士国家超级计算中心负责阿尔卑斯超级计算机的主任 Thomas Schultess 表示:“我们一直在与 MeteoWiss ECMWP 以及参与 ETH EXCLAIM 和 NVIDIA Earth-2 计划的科学家合作打造一个基础设施,以期在大数据分析和超大规模计算的各个方面取得突破。”

德克萨斯高级计算中心(TACC)的执行主任 Dan Stanzione 在谈到 Vista 时表示:“我们的各个堆栈都极大提升了能效。”

他说:“这真的是一块垫脚石,推动用户从过去使用的系统转向这种将 Grace Arm CPU 和 Hopper GPU 紧密配合的新系统,而且……我们希望在几年后部署 Horizon 时,其规模将是 Vista 的 10 或 15 倍。”

加速量子进程

研究人员们还在利用当今的加速系统开拓通往未来超级计算机的道路。

于利希研究中心量子信息处理研究小组负责人 Kristel Michelson 表示,在德国,JUPITER 超级计算机“将彻底改变气候、材料、药物发现和量子计算领域的科研工作”。

她说:“ JUPITER 的架构还允许量子算法与并行 HPC 算法无缝集成,这对于有效的量子 HPC 混合模拟来说是必需的。”

CUDA Quantum 推动进步

此次演讲还展示了 NVIDIA CUDA Quantum —— 一个用于编程 CPU、GPU 和 QPU(量子计算机)的平台,是如何推进量子计算研究的。

例如,全球最大的化工企业巴斯夫的研究人员开创了一种新的混合量子经典方法,用于模拟可以保护人类免受有害金属侵害的化合物。此外,美国布鲁克海文国家实验室和 HPE 的研究人员也分别在利用 CUDA Quantum 推动前沿科研工作。

NVIDIA 还宣布与量子编程工具开发商 Classiq 合作,在以色列最大的教学医院 Tel Aviv Sourasky Medical Center 创建一个生命科学研究中心。该中心将使用 Classiq 软件和运行于 NVIDIA DGX H100 系统之上的 CUDA Quantum 。

另外,Quantum Machines 公司将在以色列国家量子中心部署首个配备 Grace Hopper 超级芯片的 NVIDIA DGX Quantum ,旨在推动各个科学领域的进步。这个 DGX 系统将连接到一台 Quantware 的超导 QPU 和一台 ORCA Computing 的光子 QPU,两者均由 CUDA Quantum 驱动。

wKgZomVUolyAFsG0AAGZLj04AuI731.png

Buck 说:“在短短两年内,NVIDIA 的量子计算平台已经拥有 120 多个合作伙伴(如上图),这证明它是一个开放、创新的平台。”

总的来说,诸多科研领域的工作揭示了一种新趋势,那就是将数据中心规模的加速计算与 NVIDIA 的全栈创新相结合。

他总结道:“加速计算正在为可持续计算铺平道路,并且已经取得了诸多进步,不仅提供令人惊叹的技术,而且将开创更加可持续、更有影响力的未来。”

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4124

    浏览量

    99742

原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    紫光展锐以全栈AI能力开启端边AI新时代

    当前,AI产业迎来关键拐点,算力重心由云端训练全面转向端边推理,AI正从内容生成加速迈向物理世界,成为可感知、可决策、可自主执行的智能体。紫光展锐依托多年技术沉淀,以全栈AI能力开启端
    的头像 发表于 05-18 11:09 494次阅读

    CoolGaN™:开启功率电子新时代

    CoolGaN™:开启功率电子新时代 在当今这个对电力需求持续增长且环保压力日益增大的时代,寻找更高效、更节能的功率电子解决方案成为了行业的关键挑战。英飞凌的CoolGaN™技术应运而生,为功率电子
    的头像 发表于 05-18 10:35 248次阅读

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 659次阅读

    SC口光纤网卡:开启光纤到桌面的新时代

    (FTTD)的新时代。 一、SC口光纤网卡的定义与特点 SC口光纤网卡是一种根据光纤模块接口类型定义命名的网络适配器,主要用于千兆光纤网络连接。其名称源于SC(Subscriber C
    的头像 发表于 03-18 10:37 368次阅读

    超级AI芯片时代,电子元器件的进化方向

    超级AI芯片时代,算力突飞猛进,行业日新月异,电子元器件的进化方向是哪里,我们要为此提前做好哪些准备?
    的头像 发表于 12-11 15:13 1194次阅读
    <b class='flag-5'>超级</b><b class='flag-5'>AI</b>芯片<b class='flag-5'>时代</b>,电子元器件的进化方向

    NVIDIA在ISC 2025分享最新超级计算进展

    从 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级
    的头像 发表于 11-25 10:59 1164次阅读
    NVIDIA在ISC 2025分享最新<b class='flag-5'>超级</b><b class='flag-5'>计算</b>进展

    AI赋能6G与卫星通信:开启智能天网新时代

    :6G+AI+卫星将支持全息通信,实现真正的\"面对面\"交流 数字孪生卫星:为每颗卫星创建精确的数字模型,用于预测和优化性能 开启智能天网新时代 AI与6G、卫星通信的融合,正在
    发表于 10-11 16:01

    vivo携手Google Cloud推动智能手机迈入AI新时代

    在人们期待更智能、更前瞻手机的时代,vivo 携手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速创新,推动智能手机迈入智能、无缝、以人为本的 AI
    的头像 发表于 09-23 16:54 1821次阅读

    适应边缘AI新时代的GPU架构

    电子发烧友网站提供《适应边缘AI新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:可重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC
    发表于 09-12 16:07

    睿海光电:以敏捷交付与全域兼容领跑AI光模块赛道,赋能智算新时代

    睿海光电:以敏捷交付与全域兼容领跑AI光模块赛道,赋能智算新时代
    的头像 发表于 08-15 16:51 1574次阅读

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    流量动态分析、违章行为智能识别;在智慧城市建设里,可检测周界入侵、消防通道占用等安全隐患。 AI 边缘计算网关正以其独特的魅力,为各行业带来前所未有的变革与机遇,引领我们大步迈向智能新时代
    发表于 08-09 16:40

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 E
    的头像 发表于 07-28 15:07 1516次阅读

    MT6701磁编芯片:开创机器人运动控制新时代

    在科技的浩瀚星空中,机器人领域无疑是一颗璀璨的明星。而在机器人的关键技术中,运动控制宛如机器人的“神经系统”,直接影响着机器人的性能表现。今天,我们要聚焦的主角——MT6701磁编芯片,正以其卓越的性能,开创着机器人运动控制的新时代
    的头像 发表于 07-23 18:18 1171次阅读

    迅为RK3576核心板高算力AI开发板开启智能应用新时代

    迅为RK3576核心板高算力AI开发板开启智能应用新时代
    的头像 发表于 06-10 14:13 1924次阅读
    迅为RK3576核心板高算力<b class='flag-5'>AI</b>开发板开启智能应用<b class='flag-5'>新时代</b>