0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Exaflop简史

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-08-03 09:54 次阅读

Exaflop 是衡量超级计算机性能的单位,表示该计算机每秒可至少进行百亿亿次浮点运算。

为了解决这个时代最复杂的问题,比如如何治疗像新冠肺炎和癌症这样的疾病、以及如何缓解气候变化等。计算机的计算量正在不断增加。

所有这些重大挑战将计算带入了现今的百亿亿次级时代,顶级性能通常以 exaflops 来衡量。

什么是 Exaflop?

Exaflop 是衡量超级计算机性能的单位,表示该计算机每秒可以至少进行 10^18 或百亿亿次浮点运算。

Exaflop 中的 exa-前缀表示“百亿亿”,即 10 亿乘以 10 亿或1的后面有 18 个零。同样,单个 exabyte 的内存子系统可以储存百亿亿字节的数据。

exaflop 中的“flop”是浮点运算的缩写。exaflop/s 是表示系统每秒浮点运算次数的单位。

浮点是指所有数字都用小数点表示的计算方法。

1000 Petaflop = 1 Exaflop

前缀 peta- 表示 10^15,即 1 的后面有 15 个零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的计算量到底有多大?相当于十亿人中的每个人都拿着十亿个计算器。

如果他们同时按下等号,就是进行了 1 个 exaflop。

拥有 Big Red 200 和其他几台超级计算机的印第安纳大学表示,exaflop 计算机的速度相当于一个人每秒钟进行一次计算,并一直计算 31,688,765,000 年。

Exaflop 简史

在超级计算发展史的大部分时间里,一次浮点运算就是一次,但随着工作负载引入 AI ,这种情况也发生了变化。

人们开始使用最高的精度格式来表示数字,这种格式被称为双精度,由 IEEE 浮点运算标准定义。它之所以被称为双精度或 FP64,是因为计算中的每个数字都需要以 64 位用 0 或 1 表示的数据块表示,而单精度为 32 位。

双精度使用 64 位确保每个数字都精确到很细微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

这种格式非常适合当时的大部分工作负载,比如从原子到飞机等全部需要确保模拟结果接近于真实的模拟。

因此,当 1993 年全球最强大的超级计算机榜单 TOP500 首次发布时,衡量 FP64 数学性能的 LINPACK 基准(又称HPL)自然成为了默认的衡量标准。

AI 大爆炸

十年前,计算行业发生了 NVIDIA 首席执行官黄仁勋所说的 AI 大爆炸。

这种强大的新计算形式开始在科学和商业应用上展现出重大成果,而且它运用了一些非常不同的数学方法。

深度学习并不是模拟真实世界中的物体,而是在堆积如山的数据中筛选,以找到能够带来新洞察的模式。

这种数学方法需要很高的吞吐量,所以用经过简化的数字(比如使用 1.01 而不是 1.0001)进行大量计算要比用更复杂的数字进行少量计算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通过 32 位、16 位和 8 位数让用户更快地进行更多计算。

混合精度不断发展

AI 使用 64 位数就如同在周末外出时带着整个衣柜。

研究人员一直在积极地为 AI 寻找理想的低精度技术。

例如首个 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式执行矩阵乘法,然后用 FP32 累积结果以获得更高的精度。

Hopper 通过 FP8 加速

最近,NVIDIA Hopper 架构首次发布了速度更快的低精度 AI 训练方法。Hopper Transformer Engine 能够自动分析工作负载,尽可能采用 FP8 并以 FP32 累积结果。

在进行计算密集度较低的推理工作,比如在生产中运行 AI 模型时,TensorFlow 和 PyTorch 等主要框架通过支持 8 位整数实现快速性能,因为这样就不需要使用小数点来完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用户可以实现每个工作负载的最优加速。

去年,IEEE P3109 委员会开始为机器学习中使用的精度格式制定行业标准。这项工作可能还需要一到两年的时间才能完成。

一些模拟软件在低精度工作中大放异彩

虽然 FP64 在模拟工作中仍然很受欢迎,但当低精度数学能够更快提供可用结果时,许多人会使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影响 HPC 应用程序性能的因素各不相同

例如,研究人员用 FP32 运行广受欢迎的汽车碰撞模拟器——Ansys LS-Dyna。基因组学也倾向于使用低精度数学。

此外,许多传统的模拟开始在部分工作流程中采用 AI。随着越来越多的工作负载使用 AI,超级计算机需要支持较低的精度才能有效运行这些新兴应用。

基准与工作负载同步发展

在认识到这些变化后,包括 Jack Dongarra(2021 年图灵奖得主和 HPL 的贡献者)在内的研究人员在 2019 年首次发布了 HPL-AI,这项新基准更适合测量新的工作负载。

Dongarra 在 2019 年的博客中表示:“无论是技术不断优化的传统模拟,还是 AI 应用,混合精度技术对于提高超级计算机的计算效率越来越重要。正如 HPL 实现了对双精度能力的基准测试一样,这种基于 HPL 的新方法可以对超级计算机的混合精度能力进行大规模基准测试。”

尤利希超级计算中心主任 Thomas Lippert 同意了这一观点。

他在去年发表的一篇博客中表示:“我们使用 HPL-AI 基准是因为它既能够准确地衡量日益增加的 AI 和科学工作负载中的混合精度工作,也能反映准确的 64 位浮点计算结果。”

现今的 Exaflop 系统

在 6 月的一份报告中,全球 20 个超级计算机中心提交了 HPL-AI 结果,其中有三个中心提供了超过 1 exaflop 的性能。

在这些系统中,橡树岭国家实验室的超级计算机在 HPL 上的 FP64 性能也超过了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 结果的采样器

两年前,一非传统系统首次达到 1 exaflop。这台由 Folding@home 联盟组装的众源超级计算机在呼吁帮助抵御新冠疫情后,达到了这一里程碑,到现在已有超过 100 万台计算机加入其中。

理论和实践中的Exaflop

许多组织从那时起就已开始安装理论峰值性能超过 1 exaflop 的超级计算机。需要注意的是,TOP500 榜单同时发布 Rmax(实际)和 Rpeak(理论)分数。

Rmax 指计算机实际表现出的最佳性能。

Rpeak 是一切系统都处于高水平运行时的最高理论性能,而这几乎从未发生过。该数值的计算方法通常是将系统中的处理器数量乘以其时钟速度,然后再将结果乘以处理器在一秒钟内可执行的浮点运算数。

因此,如果有人说他们的系统达到 1 exaflop,请询问他说的是 Rmax(实际)还是Rpeak(理论)。

Exaflop 时代的众多指标

这也是新百亿亿次时代的众多细微变化之一。

值得注意的是,HPL 和 HPL-AI 属于合成基准,即它们衡量的是数学程序的性能,而不是真实世界的应用。MLPerf 等其他基准则基于真实世界中的工作负载。

最后,衡量系统性能的最佳标准当然是它运行用户应用程序的情况。该衡量标准不是基于 exaflop,而是基于投资回报率。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103035
  • 计算机
    +关注

    关注

    19

    文章

    7493

    浏览量

    87930
  • AI
    AI
    +关注

    关注

    87

    文章

    30851

    浏览量

    269025

原文标题:什么是 Exaflop?

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TOP500第二台E级超算出现,AMD要在HPC上逆袭英特尔?

    Exaflop/s的HPL算力成绩,在开发人员的优化下,相较上次提交的1.194 Exflop/s成绩还有所提升。Frontier集成
    的头像 发表于 05-15 09:11 2412次阅读
    TOP500第二台E级超算出现,AMD要在HPC上逆袭英特尔?

    从2D走向3D的视觉传感器

    电子发烧友网报道(文/黄山明)作为机器视觉系统的主要信息源,视觉传感器一直在众多视觉设备中占据重要位置。尤其是通过视觉传感器,可以帮助机器对物品进行测量与判断,从而赋予这些机器更丰富的应用场景。而今,视觉传感器开始向3D发展,带给家用场景下更丰富和完善的功能。   视觉传感器的发展   视觉传感器的概念最早在20世纪50年代后期开始形成,并随着计算机技术的进步和机器人研究的发展而逐渐兴起。当时出现了光学倍增管(PMT)
    的头像 发表于 12-27 00:22 151次阅读

    全液冷超充爆火!特斯拉、华为领衔,五大超充产品同台PK,谁能胜出?

    电子发烧友原创 章鹰   12月24日晚间,鸿蒙智行宣布,截至2024年12月22日,华为超充网络在全国已有510座华为超充站、8712个华为超充枪,覆盖31个省份120座城市。本期新上线 34 座华为超充站,分别位于北京、上海、深圳、重庆、厦门、青岛、成都、武汉、长春、兰州、呼和浩特市等。 图:华为充电桩展台  电子发烧友拍摄   外媒报道,今年10月,特斯拉的超级充电(Supercharger)网络又实现了一个令人印象深刻的新里程碑,该公司已经在全球部署了6万个
    的头像 发表于 12-27 00:14 169次阅读
    全液冷超充爆火!特斯拉、华为领衔,五大超充产品同台PK,谁能胜出?

    安全警告系统中超声波雷达与Elmos芯片的作用

    Elmos芯片在安全警告系统中的作用是多方面的,它们不仅为AK2超声波雷达提供了精确的距离测量功能,还通过软件可配置参数提高了系统的灵活性和适应性。这些芯片的高集成度、抗干扰性和一致性,以及符合汽车电子行业标准的安全性,使得它们成为安全警告系统中不可或缺的一部分。通过这些芯片,安全警告系统能够实现更安全、更便捷的驾驶体验,满足现代汽车对高级驾驶辅助系统(AD
    的头像 发表于 12-27 00:00 38次阅读
    安全警告系统中超声波雷达与Elmos芯片的作用

    安森美(onsemi)的超声波传感器解决方案的未来趋势和创新

    简要介绍超声波传感器的发展历程,并结合当前和未来的应用,预测未来几年超声波传感器的应用领域。      汽车超声波传感器简史 超声波技术常用于检测物体和发现固体材料中的缺陷,其首项专利可以追溯到上世纪30年代。一直
    的头像 发表于 11-23 14:53 1015次阅读

    名单公布!【书籍评测活动NO.50】亲历芯片产线,轻松图解芯片制造,揭秘芯片工厂的秘密

    的知识门槛低,又独家揭秘了芯片制造工厂的运营到管理,适用于更大读者群。本书非常适合对芯片这个话题(不管是技术还是产业运营等)感兴趣的IC从业者和大众读者。 相信阅读过《芯路》《半导体简史》《图解
    发表于 11-04 15:38

    【「ARM MCU嵌入式开发 | 基于国产GD32F10x芯片」阅读体验】+书籍整体概况

    系统的概念,ARM简史,以及前期的准备工作,视频时长112min。 第二章介绍GD32F10x的架构,包含计算机架构,Cortex-M3架构;第三章通用输入/输出端口GPIO介绍,内容非常丰富,介绍
    发表于 08-25 22:48

    Perforce静态代码分析专家解读MISRA C++:2023®新标准:如何安全、高效地使用基于范围的for循环,防范未定义行

    Frank van den Beuken博士的博客系列,本期为第三篇。 在前两篇系列文章中,我们向您介绍了 新的MISRA C++ 标准 和 C++简史 。本文,我们将仔细研究C++中以for循环为中心
    的头像 发表于 06-18 12:57 417次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    72个 NVLink 连接的Blackwell GPU 和 30TB 的统一内存,在130TB/s 的计算结构上运行,GB200 NVL72 在单个机架中创造了一个exaFLOP 级别的 AI 超级
    发表于 05-13 17:16

    宽带上网技术简史(2024版)

    在如今这个数字时代,宽带已经成为我们每个人、每个家庭的生活必需品。如果没有它,我们会坐立难安、心绪不宁。那么,你知道宽带背后的技术原理吗?从最早期的56k“猫”拨号,到现在的千兆城市、千兆家庭,我们的宽带技术到底经历了怎样的变革?今天这篇文章,我们就来详细了解一下——“宽带的故事”。█xDSL和ISDN下面这个界面,你见过吗?我相信很多70后80后的小伙伴,
    的头像 发表于 04-20 08:05 1059次阅读
    宽带上网技术<b class='flag-5'>简史</b>(2024版)

    算力简史,是一段波澜壮阔的历史

    今天这篇文章,我将给大家详细介绍一下人类算力的演进过程。这是一段波澜壮阔的历史,值得我们驻足与回忆。Chrent人工算力时代人类对算力的利用,从远古时期就已经开始了。大脑,是我们最原生的算力工具。依靠大脑所提供的算力,我们才得以生存。动物也有大脑,也有算力,但是远远不如人类强劲。在漫长的进化过程中,人类的大脑越来越发达,最终帮助自己从万物生灵中脱颖而出,成为
    的头像 发表于 04-04 08:26 664次阅读
    算力<b class='flag-5'>简史</b>,是一段波澜壮阔的历史

    什么是SaaS?中国SaaS发展简史

    SaaS融合了软件与云计算的优势,在这种服务模式下,用户不仅获得了软件的功能,更重要的是,用户拥有数据与隐私权。
    发表于 03-14 11:30 719次阅读
    什么是SaaS?中国SaaS发展<b class='flag-5'>简史</b>

    单片机发展简史

    单片机出现的历史并不长,但发展十分迅猛。它的产生与发展和微处理器(CPU)的产生与发展大体同步,自1971年美国英特尔公司首先推出4位微处理器以来,它的发展到目前为止大致可分为5个阶段。
    发表于 03-14 11:22 1358次阅读

    全球AGV发展简史

    AGV(自动引导车)是一种自动化材料搬运机器人,自上世纪50年代发展至今,应用范围不断扩大,已广泛应用于制造、仓库、医院和机场等领域。现代AGV具备更高安全性和承载能力,可运输更多种物品,并可通过与云计算和大数据分析结合实现更智能的自动化控制。未来,AGV技术将持续改进和完善,成为制造业和物流业智能化发展的重要力量。
    的头像 发表于 02-27 18:20 1259次阅读

    C++简史:C++是如何开始的

    MISRA C++:2023,MISRA® C++ 标准的下一个版本,来了!为了帮助您做好准备,我们介绍了 Perforce 首席技术支持工程师 Frank van den Beuken 博士撰写的 MISRA C++:2023 博客系列的第二部分。 在这篇博客中,我们将深入探讨 C++ 的历史、编程语言多年来的发展历程以及它的下一步发展方向。
    的头像 发表于 01-11 09:00 590次阅读
    C++<b class='flag-5'>简史</b>:C++是如何开始的