0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA赢得四项最新行业指标

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-11-21 10:57 次阅读

在五项新的行业指标中,NVIDIA 赢得了其中的四项。这些指标聚焦于AI在高性能计算中的应用,是一种推动科学和行业进步的方法。

MLPerf HPC 1.0 是用于衡量高性能计算中 AI 性能的行业基准测试,而 NVIDIA 赋能的系统在该基准的五项测试中胜出四项。

MLPerf 是用于深度学习的行业基准测试,首次发布于 2018 年 5 月。上述战绩是 MLPerf 基准测试的最新结果。MLPerf HPC 解决了一种计算方式,可借助 AI 加速并增强超级计算机上的模拟

分子动力学、天文学和气候模拟的近期进展都使用 HPC+AI 取得了科学突破。这种趋势可以推动科学和工业领域用户采用E级(Exascale) AI。

基准测试衡量内容

MLPerf HPC 1.0 在 HPC 中心的三个典型工作负载中测试 AI 模型训练。

Cosmoflow 判断望远镜图像中物体的细节。

Deepcam 测试对气候数据中飓风和大气河流的检测

Opencatalyst 跟踪系统预测分子中原子间力的成效。

每个测试分为两个部分。衡量系统训练模型的速度的指标被称为强标度。其对应的弱标度是衡量系统最大吞吐量的指标,即系统在给定时间内可以训练多少模型。

与去年 MLPerf 0.7 那一轮的强标度最佳成绩相比,NVIDIA 为 Cosmoflow 性能提升了多达 5 倍。在 deepcam 方面,则将性能提高了近 7 倍以上。

劳伦斯伯克利国家实验室 (Lawrence Berkeley National Laboratory) 的 Perlmutter 系统使用了 5,120 个 NVIDIA A100 Tensor Core GPU 中的 2,048 个,在 opencatalyst基准中成绩斐然。

在弱标度类别中,NVIDIA使用每个作业 16 个节点和 256 个同时作业来主导 deepcam。NVIDIA所有的测试都在 NVIDIA Selene(如上图),即NVIDIA内部系统和大型工业超级计算机上运行。

最新结果显示 NVIDIA AI 平台及其性能领先性的另一个维度。这是 NVIDIA 第八次在 MLPerf 基准中获得最高分,该基准涵盖数据中心、云和网络边缘的 AI 训练和推理。

庞大的生态系统

本轮八名参与者中有七名使用 NVIDIA GPU 提交了结果。

其中包括德国于利希超级计算中心、瑞士国家超算中心,以及美国的阿贡国家实验室、劳伦斯伯克利国家实验室、国家超级计算机应用中心和德克萨斯高级计算中心。

于利希超算中心(Jülich Supercomputing Centre)主任 Thomas Lippert 表示:“通过基准测试,我们已经证明我们的机器能够在实践中发挥其潜力,并有助于让欧洲在 AI 方面保持领先。”

MLPerf 基准由 MLCommons 提供支持。后者是由阿里巴巴、Google、英特尔、Meta、NVIDIA 等牵头的行业组织。

我们的实现方式

如此强劲的表现都得益于 NVIDIA AI 平台的成熟发展。该平台目前已包括完整的软件堆栈。

在这一轮中,NVIDIA使用每个人都可以使用的工具来调整代码,例如可以加速数据处理的 NVIDIA DALI 和能够减少小批量延迟的 CUDA Graphs,追踪将横向扩展到 1,024 个或更多个 GPU。此外还应用了 NVIDIA SHARP,这是 NVIDIA MagnumIO 中的一个关键组件,可提供网络计算以加速通信并将数据操作卸载到 NVIDIA Quantum InfiniBand 交换机网络。

NVIDIA用于提交作品的所有软件均可从 MLPerf 仓库获得。NVIDIA定期将此类代码添加到 NGC 目录。该目录是NVIDIA预训练 AI 模型、行业应用程序框架、GPU 应用程序和其他软件资源的软件中心。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102993
  • AI
    AI
    +关注

    关注

    87

    文章

    30734

    浏览量

    268895

原文标题:SC21 | MLPerf 基准测试阐明为什么 AI 是 HPC 的未来

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型将推动行业创新和效率提升。
    的头像 发表于 12-18 13:49 161次阅读

    欣旺达荣获四项可持续发展大奖

    近日,欣旺达在可持续发展领域捷报频传,相继斩获了四项重量级大奖,展现了其在绿色、低碳、环保方面的卓越表现。 首先,欣旺达荣获了新华社颁发的“2023-2024智能零碳成果案例”奖,这一奖项充分认可了
    的头像 发表于 12-16 11:30 214次阅读

    亿纬锂能荣获福田汽车四项大奖

    、欧曼合作共赢奖等四项大奖,亿纬锂能高级副总裁朱延春、动力国内营销中心大客户销售中心总经理黄红良受邀出席大会。
    的头像 发表于 12-12 18:09 345次阅读

    晶科能源连获四项雇主荣誉

    2024接近尾声,晶科能源凭借强劲的雇主品牌影响力接连获得四项荣誉大奖,这不仅是对过去一年成就的肯定,也是对未来潜力的最佳证明,荣耀时刻,与你共享共庆。
    的头像 发表于 12-11 10:19 122次阅读

    华为携手运营商荣获Glotel 2024四项大奖

    旗下电信行业媒体Telecoms.com主办,旨在表彰为电信产业发展与转型做出卓越贡献并持续创新的公司。华为与中国移动、中国广电、stc、IOH携手获得四项大奖,是行业对华为与全球运营商在全面数智化运维运营领域持续创新并获得商业
    的头像 发表于 11-29 11:24 425次阅读

    TPA311D1的四项增益可选是什么意思呢?

    请问调节电位器是在调节功放的放大倍数么? TPA311D1的四项增益可选是什么意思呢?这四项增益是阶跃式还是连续的?
    发表于 11-04 06:46

    维信诺四项高性能显示技术

    OLED显示技术持续在创新浪潮中前行,低功耗、窄边框、多形态等创新技术不断发展并受到市场欢迎。为充分满足市场需求,推动显示性能的精进,维信诺在SID展会带来4高性能前沿技术。
    的头像 发表于 09-20 10:11 518次阅读

    维信诺四项屏幕集成创新技术

    屏幕作为信息交互的窗口,正沿着多种功能集成一体化方向演进,带来更多维、更便捷的交互体验。本届展会,维信诺带来四项屏幕集成创新技术,不仅拓宽了屏幕技术的边界,也为用户带来了+1+1+1+1的交互升级。
    的头像 发表于 09-20 10:07 524次阅读

    在THS3201的datasheet中,有一指标noise figure,其值为11dB,这个指标怎么解释?

    请问专家,在THS3201的datasheet中,有一指标noise figure,其值为11dB(G=10V/V,RG=28欧姆,RF=255欧姆),这个指标怎么解释?
    发表于 09-12 06:25

    单对以太网 (SPE) 连接器的四项主要优势

    、8芯,减少为双芯。可显著减少连接器、连接线的体积、重量,让设备的布线更灵活。在实际应用中,单对以太网 (SPE) 连接器的四项主要优势包括: 高频率:SPE连接器的传输频率为1-600MHz,而传统
    的头像 发表于 08-14 08:35 552次阅读
    单对以太网 (SPE) 连接器的<b class='flag-5'>四项</b>主要优势

    大Google更新将登陆Samsung设备

    在近期的 Galaxy Unpacked 发布会上,我们宣布了四项即将在 Samsung 最新设备中推出的 Google 更新,这些设备包括 Galaxy Z Flip6、Z Fold6 和最新款 Galaxy 手表。
    的头像 发表于 08-09 16:58 785次阅读

    NVIDIA和谷歌云宣布开展一新的合作,加速AI开发

    NVIDIA 和谷歌云宣布开展一新的合作,以帮助全球初创企业加速创建生成式 AI 应用和服务。
    的头像 发表于 04-11 14:03 506次阅读

    ROG助力i9-14900KS达到9117.75 MHz,创下四项世界纪录

    近日,据 ROG 玩家国度官方微博透露,ROG MAXIMUS Z790 APEX ENCORE 助力 i9-14900KS 刷新至 9117.75 MHz,创造四项世界纪录(CPU 频率、SUPERPI 1M、PIFAST、PYPRIME 32B)。
    的头像 发表于 03-15 11:40 681次阅读

    NVIDIA即将推出一新的生成式AI专业认证

    NVIDIA 即将推出一新的生成式 AI 专业认证,助力开发者在这一重要领域证明自身技术实力。
    的头像 发表于 03-14 09:43 541次阅读

    GTI颁奖典礼落幕,华为无线再度斩获四项大奖

    在刚刚落幕的GTI Awards 2024颁奖典礼上,华为无线再度斩获四项大奖。
    的头像 发表于 03-01 09:38 418次阅读