0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Blackwell平台带来性能跃升

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-11-19 14:24 次阅读

Blackwell 完成的每一项测试,都为各项 AI 应用树立了训练性能新标杆。

对于使用文本、计算机代码、蛋白质链、摘要、视频甚至 3D 图形的生成式 AI 应用,它们需要数据中心规模的加速计算来高效地训练其背后的大语言模型(LLM)。

在 MLPerf Training 4.1 行业基准测试中,NVIDIA Blackwell 平台在所有参与测试的工作负载上都取得了令人赞叹的测试结果。在 LLM 基准测试中,每块 GPU 的性能提高了 2.2 倍,其中包括 Llama 2 70B 微调和 GPT-3 175B 预训练。

此外,NVIDIA 提交的 NVIDIA Hopper 平台测试结果继续在所有基准测试上保持了规模级的记录,包括使用 11,616 块 Hopper GPU 进行的 GPT-3 175B 基准测试。

Blackwell 带来性能跃升

这是 NVIDIA 首次向 MLCommons 联盟提交 Blackwell 的训练测试结果,其结果突显了该架构是如何提高生成式 AI 训练性能的。MLCommons 联盟为业内公司创建了标准化、公正且经过严格的同行评审的测试。

例如,Blackwell 架构包括新的核函数,它们可以更高效地使用 Tensor Core。这些核函数执行优化的专用数学运算,例如矩阵乘,是许多深度学习算法的主要计算。

Blackwell 拥有更高的每块 GPU 计算吞吐量以及更大、更快的高带宽内存,使其能够在更少的 GPU 上运行 GPT-3 175B 基准测试,同时实现出色的每块 GPU 性能。

通过利用容量更大、带宽更高的 HBM3e 内存,仅仅 64 块 Blackwell GPU 就能够运行 GPT-3 LLM 基准测试,并且不损失每块 GPU 性能。使用 Hopper 进行相同的基准测试时则需要 256 块 GPU。

在提交 Blackwell 的训练测试结果之前,NVIDIA 还提交了 MLPerf Inference 4.1 推理测试结果。在该测试中,Blackwell 的 LLM 推理性能比 Hopper 高出 4 倍。测试结果显示,通过利用 Blackwell 架构的 FP4 精度以及 NVIDIA QUASAR 量化系统,Blackwell 在满足基准测试的精度要求的同时展现出了强大的性能。

持续优化

经过持续的软件开发,NVIDIA 平台在各种框架、模型和应用的训练和推理方面获得了性能提升和功能改进。

在本轮提交的 MLPerf 训练测试结果中,当使用 GPT-3 175B 进行训练时,Hopper 的每块 GPU 训练性能比上次提交该基准测试时提高了 1.3 倍。

NVIDIA 还提交了 GPT-3 175B 基准测试的大规模测试结果,该测试使用了 11,616 块 Hopper GPU,这些 GPU 通过 NVIDIA NVLink 和 NVSwitch 高带宽 GPU 间通信以及 NVIDIA Quantum-2 InfiniBand 网络连接在一起。

自去年以来,NVIDIA Hopper GPU 在 GPT-3 175B 基准测试中的规模和性能提升了三倍多。此外,在 Llama 2 70B LoRA 微调基准测试中,NVIDIA 在使用相同数量的 Hopper GPU 的情况下将性能提高了 26%,这体现了软件方面的持续优化。

NVIDIA 持续优化加速计算平台的努力,使其 MLPerf 测试结果得以不断提升——提高了容器化软件的性能,为使用现有平台的合作伙伴和客户带来更强大的算力,并让他们从平台投资中获得更高的回报。

携手合作

NVIDIA 的合作伙伴——包括华硕、Azure、思科、戴尔、富士通、Giga Computing、Lambda Labs、联想、Oracle Cloud、云达科技和超微等系统制造商和云服务提供商——也在最新一轮 MLPerf 测试中提交了令人印象深刻的测试结果。

作为 MLCommons 的创始成员,NVIDIA 认为,行业标准的基准测试和基准测试最佳实践对于 AI 计算而言至关重要。通过获取经过同行评审、精简的 AI 和 HPC 各个平台的对比信息,企业可以跟上最新的 AI 计算创新步伐,并获得有助于指导其重大平台投资决策的关键数据。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4929

    浏览量

    102788
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128672
  • 计算机
    +关注

    关注

    19

    文章

    7409

    浏览量

    87691
  • LLM
    LLM
    +关注

    关注

    0

    文章

    272

    浏览量

    304

原文标题:巅峰的训练性能:Blackwell 在 MLPerf 测试中将训练性能带到新高度

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA向开放计算项目捐赠Blackwell平台设计

    近日,在美国加利福尼亚州举行的 OCP 全球峰会上,NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放计算项目(OCP),并扩大
    的头像 发表于 11-19 15:30 103次阅读

    NVIDIA未来1年的Blackwell订单已全部售罄

    10月12日资讯显示,Blackwell无疑已成为NVIDIA历史上极为成功的产品典范,其市场需求量已攀升至前所未有的高峰。   凭借在全球AI算力领域的领先地位,Blackwell吸引了微软、Meta、Oracle、Op
    的头像 发表于 10-12 16:20 600次阅读

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力
    的头像 发表于 09-09 09:57 404次阅读
    利用<b class='flag-5'>NVIDIA</b> RAPIDS加速DolphinDB Shark<b class='flag-5'>平台</b>提升计算<b class='flag-5'>性能</b>

    NVIDIA 在 Hot Chips 大会展示提升数据中心性能和能效的创新技术

    来源: NVIDIA 在此次大会期间举行的四场演讲中,NVIDIA 工程师详细介绍了 NVIDIA Blackwell 平台、新的液冷研究成
    的头像 发表于 08-28 16:38 326次阅读
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大会展示提升数据中心<b class='flag-5'>性能</b>和能效的创新技术

    NVIDIA AI芯片Blackwell推迟发布引热议,公司强调Hopper需求强劲

    据8月5日最新消息,NVIDIA新款AI芯片Blackwell因被曝存在设计缺陷而推迟发布的消息,迅速在业界引发了广泛讨论与关注。面对这一市场传闻,NVIDIA官方迅速作出回应,强调其旗舰产品
    的头像 发表于 08-05 15:05 521次阅读

    NVIDIA CEO黄仁勋在 SIGGRAPH 2024 主题演讲中或将首次亮相消费级GPU Blackwell

    ABSTRACT摘要NVIDIA首席执行官黄仁勋将在2024年Siggraph上发表主题演讲,主题为“面向新计算革命的图形”——消费级Blackwell即将到来?JAEALOT2024年6月20日
    的头像 发表于 06-21 08:26 416次阅读
    <b class='flag-5'>NVIDIA</b> CEO黄仁勋在 SIGGRAPH 2024 主题演讲中或将首次亮相消费级GPU <b class='flag-5'>Blackwell</b>

    英伟达Blackwell架构,行业首选

    的半导体技术路径图,首度公开了即将面世的下一代芯片——Rubin平台,旨在接替现有的Blackwell。   回顾过往,NVIDIA始终保持着每两年发布一次全新架构的传统,从2020年的Ampere
    的头像 发表于 06-05 15:28 591次阅读

    NVIDIA Blackwell平台推动科学计算突破发展

    最新加速器和网络平台提升高级模拟、AI、量子计算、数据分析等方面的性能
    的头像 发表于 05-15 09:45 329次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    人工智能模型在规模和复杂性上呈指数级增长,对先进计算能力和内存容量的需求变得至关重要。Blackwell图形处理器架构通过在性能和效率方面实现大幅跃升,解决了这些需求。 HGX B200 训练
    发表于 05-13 17:16

    超微电脑借助英伟达Blackwell架构,打造顶尖生成式AI系统

    超微电脑Supermicro近日宣布,其全新一代人工智能系统已正式问世,该系统基于NVIDIA的革命性Blackwell架构,展现了前所未有的人工智能性能。该系列新品包括NVIDIA
    的头像 发表于 03-25 10:27 537次阅读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的 NVIDIA DGX Sup
    的头像 发表于 03-21 09:49 651次阅读

    NVIDIA宣布推出NVIDIA Blackwell平台以赋能计算新时代

    全新 Blackwell GPU、NVLink 和可靠性技术赋能万亿参数规模的 AI 模型
    的头像 发表于 03-20 09:44 548次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多
    发表于 03-19 10:56 379次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

    根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。
    的头像 发表于 03-04 09:33 1245次阅读
    <b class='flag-5'>NVIDIA</b>将在今年第二季度发布<b class='flag-5'>Blackwell</b>架构的新一代GPU加速器“B100”

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的强大功能,提供突破性的网络、安全和存储性能
    的头像 发表于 02-23 10:02 427次阅读