0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SC23 | 新型加速节能 AI 系统开创超级计算的新时代

NVIDIA英伟达 来源:未知 2023-11-15 18:45 次阅读

世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式 AI 和 HPC 来应对科学和工业领域的重大挑战。

11 月 13 日,NVIDIA 在 SC23 上发布了一系列新技术,将全球各地的科学和工业研究中心推向性能和能效新高。

NVIDIA 高性能计算和超大规模数据中心业务副总裁 Ian Buck 在 SC 大会发表的特别演讲中提到:“NVIDIA 的硬件和软件创新正在创造一种新型 AI 超级计算机。”

其中一些超级计算机将配备内存增强的 NVIDIA Hopper 加速器,另一些则采用全新 NVIDIA Grace Hopper 系统架构。它们都将使用扩展的并行结构来运行面向生成式 AI 、HPC 和混合量子计算的全栈加速软件。

Buck 将全新 NVIDIA HGX H200 称为“世界领先的 AI 计算平台”。

它配备高达 141 GB 的 HBM3e,是首款使用这项超快技术的 AI 加速器。在运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的性能比上一代加速器高出 18 倍。

wKgZomVUolyAb7tRAAF9ECI1Zks126.png

NVIDIA H200 Tensor Core GPU 配备HBM3e 内存,

可运行不断增长的生成式 AI 模型

在其他生成式AI基准测试中,它们在一个 Llama2-13B 大语言模型(LLM)上每秒可快速通过 12,000 个 token 。

Buck 还展示了一个服务器平台,该平台在一个 NVIDIA NVLink 互联下连接了四个 NVIDIA GH200 Grace Hopper 超级芯片。这一四组芯片的配置使得在一个计算节点内有高达 288 个 Arm Neoverse 核心,以及 2.3 TB 的高速内存 ,实现了 16 petaflops 的 AI 性能。

wKgZomVUolyAYUweAAFdB4NWpNE304.png

基于四个 GH200 超级芯片的服务器节点,提供 16 petaflops 的 AI 性能

采用 NVIDIA TensorRT-LLM 开源库的单个 GH200 超级芯片比一个双插槽 x86 CPU 系统快 100 倍,比一台 x86 + H100 GPU 服务器节能近 2 倍,展现了卓越的节能效果。

Buck 说:“加速计算是可持续的计算。通过充分利用加速计算和生成式 AI,我们可以推动各行各业的创新,同时减少对环境的影响。”

新上榜 TOP500 的 49 个系统中

有 38 个采用了 NVIDIA 技术

最新发布的全球最快的超级计算机 TOP500 榜单显示,人们正在转向加速、节能的超级计算。

由于诸多新建超级计算机采用了 NVIDIA H100 Tensor Core GPU,NVIDIA 目前在这些世界领先的系统中提供超过 2.5 exaflops 的 HPC 性能,相较此前 5 月榜单中的 1.6 exaflops 有了不少提升。仅在全球超级计算机 Top 10 中,NVIDIA 就提供近 1 exaflop 的 HPC 性能和 72 exaflops 的 AI 性能。

在新榜单中,采用 NVIDIA 技术的超级计算机数量再创新高,从 5 月份的 372 个增加到 379 个,其中包括 49 个新上榜超级计算机中的 38 个。

部署在 Microsoft Azure 中的 Eagle 系统是算力最高的新上榜超级计算机,其采用 H100 GPU,在 NDv5 实例中以 561 petaflops 的算力在总榜中排名第三。巴塞罗那的 Mare Nostrum5 排名第 8 ,而最近在 MLPerf 基准测试中创下 AI 训练新纪录的 NVIDIA Eos 排名第 9 。

在 Green500 的前 30 名中有 23 个采用了 NVIDIA GPU ,彰显了它们的节能优势。配备 H100 GPU 的 Henri 系统蝉联第一,它位于纽约 Flatiron 研究所,能效为每瓦 65.09 gigaflops 。

使用生成式 AI 探索新冠病毒

美国阿贡国家实验室展现了无限可能,它使用 NVIDIA BioNeMo(一个面向生物分子大语言模型的生成式 AI 平台)开发了 GenSLM 模型。这个模型可以生成与冠状病毒的现实变种非常相似的基因序列。使用 NVIDIA GPU 以及来自 150 万个新冠病毒基因组序列的数据,它还可以快速识别出新的病毒变种。

这项工作去年获得了戈登·贝尔特别奖,并在包括美国阿贡国家实验室的 Polaris 系统、美国能源部的 Perlmutter 和 NVIDIA 的 Selene 在内的超级计算机上进行了训练。

NVIDIA 医疗业务副总裁 Kimberly Powell 在此次特别演讲中提到:“这只是冰山一角。随着生成式 AI 不断重新定义科学探索,未来充满了无限可能。”

节约时间、金钱和能源

Buck 提到,使用最新技术为工作负载加速可以将系统的成本和能耗降低一个数量级。

例如,西门子与梅赛德斯合作为新其款 EQE 电动汽车分析空气动力学和相关声学。这类模拟此前在 CPU 集群上通常耗时数周时间,而借助最新的 NVIDIA H100 GPU ,其速度要快很多。此外,Hopper GPU 使成本降低了 3 倍,能耗降低了 4 倍(如下如所示)。

wKgZomVUolyAD4GCAADNSTe1028207.png

明年将开启 200 Exaflops 时代

在全球各地,部署这些最新系统将推动科学和工业领域不断取得进步。

Buck 说:“我们已经看到,2024 年将有基于 Grace Hopper 超级计算机的总计 200 exaflopsAI 算力投入生产。”

其中包括德国于希利研究中心的大型 JUPITER 超级计算机。它可以为 AI 训练提供 93 exaflops 的性能,为 HPC 应用提供 1 exaflop 的性能,而能耗仅为 18.2 兆瓦。

wKgZomVUolyAU-OZAACpjCa0koM282.png

GH200 为研究中心带来性能飙升

基于 Eviden 的 BullSequana XH3000 液冷系统,JUPITER 将使用 NVIDIA quad GH200 系统架构和 NVIDIA Quantum-2 InfiniBand 网络,用于进行气候和天气预测、药物发现、混合量子计算和数字孪生。JUPITER 所采用的 quad GH200 节点将配置 864 GB 的高速内存。

这是 NVIDIA 在 SC23 上宣布的数个使用 Grace Hopper 的新型超级计算机之一。

慧与(Hewlett Packard Enterprise)的 HPE Cray EX2500 系统将为明年投入使用的众多AI超级计算机配备 quad GH200。

例如,慧与建设的 OFP-II(一个由日本筑波大学和东京大学共享的先进 HPC 系统)以及 DeltaAI 系统(将使美国国家超级计算应用中心的算力提升三倍)均将采用 quad GH200。

HPE 正在为美国洛斯阿拉莫斯国家实验室建造 Venado 系统,这是在美国部署的首个 GH200,其还将在中东、瑞士和英国建设更多 GH200 超级计算机。

德克萨斯及更多地区采用 Grace Hopper

在德克萨斯高级计算中心(TACC),戴尔科技集团正在使用 NVIDIA Grace Hopper 和 Grace CPU 超级芯片建造 Vista 超级计算机。

Buck 表示,包括美国航空航天局艾姆斯研究中心(NASA Ames Research Center)和 Total Energies 在内的全球 100 多个企业和组织已经采购了 Grace Hopper 早期访问系统。

此前已宣布采用 GH200 的用户包括软银和布里斯托大学,以及配备 14000 个 NVIDIA A100 GPU 的大型 Leonardo 系统,后者为意大利 Cineca 联盟提供 10 exaflops 的 AI 性能。

超算中心的观点

来自世界各地超算中心的主管介绍了他们采用最新系统的计划及进展。

瑞士国家超级计算中心负责阿尔卑斯超级计算机的主任 Thomas Schultess 表示:“我们一直在与 MeteoWiss ECMWP 以及参与 ETH EXCLAIM 和 NVIDIA Earth-2 计划的科学家合作打造一个基础设施,以期在大数据分析和超大规模计算的各个方面取得突破。”

德克萨斯高级计算中心(TACC)的执行主任 Dan Stanzione 在谈到 Vista 时表示:“我们的各个堆栈都极大提升了能效。”

他说:“这真的是一块垫脚石,推动用户从过去使用的系统转向这种将 Grace Arm CPU 和 Hopper GPU 紧密配合的新系统,而且……我们希望在几年后部署 Horizon 时,其规模将是 Vista 的 10 或 15 倍。”

加速量子进程

研究人员们还在利用当今的加速系统开拓通往未来超级计算机的道路。

于利希研究中心量子信息处理研究小组负责人 Kristel Michelson 表示,在德国,JUPITER 超级计算机“将彻底改变气候、材料、药物发现和量子计算领域的科研工作”。

她说:“ JUPITER 的架构还允许量子算法与并行 HPC 算法无缝集成,这对于有效的量子 HPC 混合模拟来说是必需的。”

CUDA Quantum 推动进步

此次演讲还展示了 NVIDIA CUDA Quantum —— 一个用于编程 CPU、GPU 和 QPU(量子计算机)的平台,是如何推进量子计算研究的。

例如,全球最大的化工企业巴斯夫的研究人员开创了一种新的混合量子经典方法,用于模拟可以保护人类免受有害金属侵害的化合物。此外,美国布鲁克海文国家实验室和 HPE 的研究人员也分别在利用 CUDA Quantum 推动前沿科研工作。

NVIDIA 还宣布与量子编程工具开发商 Classiq 合作,在以色列最大的教学医院 Tel Aviv Sourasky Medical Center 创建一个生命科学研究中心。该中心将使用 Classiq 软件和运行于 NVIDIA DGX H100 系统之上的 CUDA Quantum 。

另外,Quantum Machines 公司将在以色列国家量子中心部署首个配备 Grace Hopper 超级芯片的 NVIDIA DGX Quantum ,旨在推动各个科学领域的进步。这个 DGX 系统将连接到一台 Quantware 的超导 QPU 和一台 ORCA Computing 的光子 QPU,两者均由 CUDA Quantum 驱动。

wKgZomVUolyAFsG0AAGZLj04AuI731.png

Buck 说:“在短短两年内,NVIDIA 的量子计算平台已经拥有 120 多个合作伙伴(如上图),这证明它是一个开放、创新的平台。”

总的来说,诸多科研领域的工作揭示了一种新趋势,那就是将数据中心规模的加速计算与 NVIDIA 的全栈创新相结合。

他总结道:“加速计算正在为可持续计算铺平道路,并且已经取得了诸多进步,不仅提供令人惊叹的技术,而且将开创更加可持续、更有影响力的未来。”

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3718

    浏览量

    90623

原文标题:SC23 | 新型加速节能 AI 系统开创超级计算的新时代

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算

    、超大规模的 AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus 是世界上最大的 AI 超级计算机,目前正被
    发表于 10-30 09:33 92次阅读
    NVIDIA 以太网<b class='flag-5'>加速</b> xAI 构建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>机

    NVIDIA助力丹麦发布首台AI超级计算

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机。
    的头像 发表于 10-27 09:42 321次阅读

    华为李鹏:拥抱5G-A,迈向体验经营新时代

    和生态系统已经为5G-A规模商用铺平了道路。产业需要抓住"供需跃升"的机遇,加速能力聚合与模式创新,迈向体验经营新时代。 李鹏说:"面对加速到来的移动
    的头像 发表于 06-29 17:47 1465次阅读
    华为李鹏:拥抱5G-A,迈向体验经营<b class='flag-5'>新时代</b>

    《科技日报》英文版头版头条:“本源悟空”开启中国量子计算新时代

    《科技日报》英文版头版头条:“本源悟空”开启中国量子计算新时代
    的头像 发表于 05-19 08:22 524次阅读
    《科技日报》英文版头版头条:“本源悟空”开启中国量子<b class='flag-5'>计算</b><b class='flag-5'>新时代</b>

    NVIDIA和Recursion利用AI超级计算机加快新药研发

    BioHive 由 NVIDIA AI 驱动,用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中,它的排名上升了 100 多位。
    的头像 发表于 05-16 09:46 1186次阅读
    NVIDIA和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算</b>机加快新药研发

    NVIDIA Grace Hopper点亮AI超级计算新时代

    瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力,以支持突破性研究。
    的头像 发表于 05-15 09:46 324次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    、存储和安全加速的内置软件定义硬件加速器,BlueField 可为各种环境中的多种工作负载提供安全的加速基础设施,助力企业步入加速计算
    发表于 05-13 17:16

    华为提出业界首个L4级AI安全智能体,迈入智能防御新时代

    2024华为分析师大会期间,在“加速迈向网络智能化”论坛上,华为提出业界首个L4级AI安全智能体,该智能体架构为人工智能时代全球网络安全防御提供了新的思路和方向,引领网络安全迈入智能防御新时代
    的头像 发表于 04-19 09:23 495次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    Blackwell GPU 连成一个整体,由NVIDIA 系统专家加速即时 AI 基础设施的部署       美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年 3 月 18 日
    发表于 03-19 10:56 345次阅读
    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    荣耀引领端侧AI新时代

    在今年的MWC盛会上,荣耀宣布与高通、Meta携手,将70亿参数大模型引入端侧,这一创新举措预示着端侧AI新时代的到来。荣耀终端CEO赵明在发布会上详细介绍了荣耀魔法大模型,并通过现场演示展示了其强大的功能,包括任意门和一键成片等MagicOS 8.0中的全新
    的头像 发表于 03-01 10:28 549次阅读

    加速计算卡与AI显卡有什么区别?

    加速计算卡与AI显卡有什么区别? 加速计算卡与AI显卡是两种不同的硬件设备,它们在设计和功能上有
    的头像 发表于 01-09 14:10 1221次阅读

    超级电容能给汽车加速吗?

    加速吗?让我们看看超级电容器能否在汽车领域发挥它的超级之处。我们先从燃料汽车和新能源汽车两方面看看超级电容能起到什么作用?一,超级电容器在燃
    发表于 01-06 16:31

    光宝科技在Super Computing盛会(SC23)首度实机展示「浸没式液冷技术」

    光宝科技革命性液冷解决方案「COOLITE」 2023年11月14日美国丹佛Super Computing盛会(SC23) 首度实机展示划时代变革的「浸没式液冷技术」 丹佛2023年11月17日
    的头像 发表于 11-17 09:51 673次阅读
    光宝科技在Super Computing盛会(<b class='flag-5'>SC23</b>)首度实机展示「浸没式液冷技术」

    SC23 | NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    世界顶级服务器制造商和云服务提供商即将推出 HGX H200 系统与云实例。 11月13日,NVIDIA 宣布推出 NVIDIA HGX H200 ,为 Hopper 这一全球领先的 AI 计算平台
    的头像 发表于 11-14 20:05 415次阅读
    <b class='flag-5'>SC23</b> | NVIDIA 为全球领先的 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>平台 Hopper 再添新动力

    NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    世界顶级服务器制造商和云服务提供商即将推出 HGX H200 系统与云实例     丹佛 - SC23 - 太平洋 时间 2023 年 11 月 13 日 - NVIDIA 于今日宣布推出
    发表于 11-14 14:30 222次阅读
    NVIDIA 为全球领先的 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>平台 Hopper 再添新动力