0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于行业标准的方法

星星科技指导员 来源:amd 作者:Raghu Nambiar 2023-06-27 09:28 次阅读

最近,英特尔发布了一组基准测试,比较了英特尔至强 8462Y+ CPUAMD EPYC™ 9354 CPU 在多个工作负载中的性能。本出版物围绕 所使用的方法提出了几个问题。 与 AMD EPYC(霄龙)配置相比,为什么至强配置使用了较新版本的操作系统(™几乎总是具有更好的性能)?为什么将高性能至强处理器 8462Y+ 与主流 AMD EPYC™ 9354 处理器相对应?AMD EPYC™ 9374F 在许多工作负载上一直表现出色,本来是“可比”的处理器。最后,为什么使用非行业标准基准,因为只有数量有限的可核查行业基准,没有透明度?如果没有更多的透明度,就不清楚 AMD EPYC(霄龙)系统是否按照已发布的 AMD EPYC(霄龙)™调优指南中的建议进行了调校以获得最佳性能。

行业合作伙伴针对基于联盟的标准基准发布的结果代表了展示来自各种供应商的计算系统性能的一致方式。这些基准要求严格遵守基准测试工具包、审计方法和审查流程,以确保合规性以及系统类型和配置之间一致和公平的比较方式。

主流计算

以下是业界广泛使用的标准、可验证基准的几个示例,这些基准用于评估主流用例的实际性能。重要的是要了解所有这些测试都是由我们的合作伙伴执行的。结果不言自明:

SPECcpu® 2017 是衡量处理器性能的最流行的基准测试。它由一套由行业和学术界委员会选择的计算密集型微基准组成。表 1 显示了 AMD EPYC(霄龙)处理器在 32 核和堆栈顶部均具有无可争议的性能领先地位。

32 核
(8462Y+ 与 9374F)
堆栈
顶部(8490H 与 9654)
规格率®2017_int_基数 676 与 827(快 1.22 倍) 1010 与 1800(快 1.78 倍)
规格率®2017_fp_基数 782 与 964(快 1.23 倍) 1020 与 1480(快 1.45 倍)

表 1:SPECcpu® 2017 性能比较

SPECjbb® 2015 是一种流行的衡量标准,可以对基于服务器端 Java 的应用程序进行公平的性能测量。SPECjbb® 2015 模拟了一家拥有 IT 基础架构的公司,该基础架构处理销售点请求、在线购买和数据挖掘操作的组合。在过去的二十年中,Java在整个行业中的迅速采用使该基准与所有受众相关,包括Java虚拟机(JVM)供应商,硬件开发人员,Java应用程序开发人员,研究人员和学术界成员。表 2 显示了 AMD EPYC 在 32 个内核和堆栈顶部无可争议的性能领先地位的另一个示例。

32 核
(8462Y+ 与 9374F)
堆栈
顶部(8490H 与 9654)
SPECjbb2015 MultiJVM max-jOPS 279,312 与 359,294 (快 1.29 倍) 505,379 与 828,952 (快 1.64 倍)

表 2:SPECjbb® 2015 性能比较

RDBMS: 让我们看一下关系数据库基准测试。SAP-SD 是一种流行的基准测试,旨在帮助客户为其 IT 解决方案找到合适的硬件配置。采用 2 核 AMD EPYC 96 处理器的 9654P 系统可提供 809,570 SAPS,而采用英特尔至强铂金 2H 处理器的 8490P 系统可提供 428,730 SAPS,在系统级别性能提升 ~1.88 倍 [4]。TPC Benchmark™ E (TPC-E) 是用于对交易处理系统进行基准测试的行业标准。由 96 核 AMD EPYC 9654 处理器提供支持的单插槽服务器的性能优于由两个 60 核英特尔至强铂金 8490H 处理器提供支持的双插槽服务器,这两个处理器都运行Microsoft® SQL Server。

虚拟化:VMware® VMmark3® 是业界领先的企业虚拟化整合基准测试,可衡量 VMware vSphere® 虚拟机管理程序在各种硬件供应商平台上的性能和可扩展性。近年来,AMD 在这一领域占据主导地位,在对客户最重要的配置中创造了世界纪录的虚拟化性能:2 节点 4 总插槽 SAN、4 节点 8 总插槽 vSAN 和整体领先地位。当前一代 96 核 AMD EPYC 9654 提供了 40.51 @ 43 个模块,而堆栈顶部的 60 核英特尔至强铂金 8490 在类似的 23 节点、38 个插槽配置中提供了 23.2 @ 4 个模块,具有 ~1.73 倍的性能优势。这种性能领先地位不仅限于第四代AMD EPYC(霄龙)处理器:第三代AMD EPYC 4X处理器的性能也优于英特尔至强铂金3H[7773]。

® 2008 SPECpower_ssj:SPECpower_ssj2008基准测试套件可测量系统的功耗和性能特征。双处理器 AMD EPYC 9654 系统的能效为 30,602,而双处理器英特尔至强 8490H 系统的能效为 16,902,在比较总体ssj_ops/瓦指标时为 SPECpower_ssj2008,根据 spec.org 年公布的结果 - 基于 AMD EPYC 的服务器的能效提高了 ~1.81 倍

人工智能

人工智能 (AI) 生态系统不断发展。基准测试和工作负载在不断变化。加速器(如英特尔的 AMX)可以帮助工作负载的某些计算受限部分。相比之下,AMD 战略侧重于提供性能最高的通用内核,可在最广泛的工作负载中提供高性能。许多 AI 工作负载受内存限制(例如许多大型语言模型或 LLM),因此要么无法从 AMX 中受益,要么由于阿姆达尔定律而只能看到有限的加速。

成为应用程序密集部分的AI周期通常会卸载到加速器,例如AMD Instinct MI250或AMD Alveo V70。持续的市场演变将推动未来任何为我们的通用设备增加加速的决策。AMD 利用我们强大的 IP 和软件产品组合,例如我们的 7040U CPU。推理通常只占整个工作流程的一小部分;即使是较大的推理加速通常也只能提供较小的整体加速。

具有代表性的 AI 基准可全面衡量整个工作流程的性能。事务处理性能委员会的TPC Express Benchmark AI(TPCx-AI)旨在通过测量数据中心和云中具有代表性的端到端数据AI用例,成为行业标准。该基准测试涵盖了不同比例因子(数据集大小)的 10 个真实用例:客户细分、客户保护转录、销售预测、垃圾邮件检测、价格预测、硬件故障、产品评级、旅行分类、面部识别和欺诈检测。AMD 以在比例因子 3、10、30、100、300、1000 和 <> 中拥有领先的性能和性价比而感到自豪。

高性能计算

自 1 年推出第一代 AMD EPYC 处理器以来,高性能计算 (HPC) 一直是 AMD 的优先事项。在这方面,AMD EPYC(霄龙)处理器继续为企业和国家实验室提供领先的性能。AMD EPYC(霄龙)处理器在 2017 核和堆栈顶级处理器上均提供领先的性能,优于竞争对手。AMD 工程师通过正确调整所有 AMD 和竞争系统以获得最佳性能,例如类似的硬件设置和 BIOS 设置,并在所有系统中使用相同的操作系统和选项,努力确保所有平台都以最佳状态呈现。图 32 和图 1 显示了相对性能数字,作为每个测试应用程序的基准测试的综合平均值。

wKgaomSaPVSAHS6fAACyIn4f8co538.png

图 1:32 核性能比较

wKgaomSaOzqAJBj_AAA9G5J4xb0830.jpg

图 2:堆栈顶部性能比较

结论

AMD 依赖于由我们的生态系统合作伙伴执行、审核和发布的独立测试以及我们自己的内部测试。我们还执行自己的内部测试,投入时间和资源来表征系统,了解细微差别,并调整系统(包括我们自己和竞争对手的系统)以获得最佳性能。在 AMD,我们的客户对我们很重要,因此展示我们的处理器在相关工作负载下的表现对我们很重要。了解系统级性能至关重要的纵向扩展工作负载的堆栈顶部与堆栈顶部性能,以及与虚拟机密度很重要的云部署类似的性能比较对我们的客户来说意义重大。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19281

    浏览量

    229777
  • amd
    amd
    +关注

    关注

    25

    文章

    5468

    浏览量

    134132
  • AI
    AI
    +关注

    关注

    87

    文章

    30851

    浏览量

    269010
收藏 人收藏

    评论

    相关推荐

    关于开关电源的行业标准

    有没有哪位大神可以给出开关电源的一些行业标准或国家标准
    发表于 10-14 16:59

    可用于物联网采用CC1120且低于1GHz的无线远距离参考设计包括原理图,物料清单及参考指南

    描述窄带是一种可实现远距离射频通信的行业标准方法,与宽带解决方案相比,其具有更高的抗扰度。使用此参考设计可为物联网 (IoT) 应用测试 TI 的最远距离解决方案。此工具适于 868 至 915
    发表于 08-18 07:36

    采用CC1120的420至470MHz的超窄带远距离通信包括物料清单及原理图

    描述窄带是一种可实现远距离射频通信的行业标准方法,与宽带解决方案相比,其具有更高的抗扰度。使用此参考设计可为物联网 (IoT) 应用测试 TI 的最远距离解决方案。此工具适于 420 至 470
    发表于 08-21 07:15

    什么是FPGA的“行业标准”?

    什么是FPGA的“行业标准”?我告诉一位朋友,我想重新参与数字设计工作,但是我已经做了8年了,因为我做过这样的专业工作。我从来没有用FPGA专业地做过任何工作。她建议了解行业标准会非常有帮助。我们
    发表于 01-09 10:27

    EMC的国家标准行业标准及国际标准汇总

    EMC的国家标准行业标准及国际标准有人汇总过吗?想整理一下
    发表于 04-18 16:10

    为仪表放大器设立新的行业标准

    AD8221- 为仪表放大器设立新的行业标准
    发表于 06-17 11:07

    是否有为SAM创建主密钥的行业标准方法

    密钥的跟踪器。 我计划使用 CPU 的硅 ID 作为 SAM 主密钥,以便将它们绑定在一起 是否有为 SAM 创建主密钥的行业标准方法
    发表于 05-18 14:53

    L220 MBIST控制器技术参考手册

    MBIST是测试嵌入式存储器的行业标准方法。MBIST通过根据测试算法执行对存储器的读取和写入序列来工作。存在许多行业标准的测试算法。 MBIST控制器生成对RAM的所有位置的正确读取和写入序列,以
    发表于 08-02 14:47

    CoreLink 2级MBIST控制器L2C-310技术参考手册

    MBIST是测试嵌入式存储器的行业标准方法。MBIST通过根据测试算法执行对存储器的读取和写入序列来工作。存在许多行业标准的测试算法。 MBIST控制器生成对RAM的所有位置的正确读取和写入序列,以
    发表于 08-02 17:33

    ARM L210 MBIST控制器技术参考手册

    MBIST是测试嵌入式存储器的行业标准方法。MBIST通过根据测试算法执行对存储器的读取和写入序列来工作。存在许多行业标准的测试算法。MBIST控制器生成正确的读取和写入序列。ARM L210 MBIST控制器用于与ARM L2
    发表于 08-02 08:07

    led行业标准

    led行业标准 1. 国外led相关标准现状,LED标准现状,led国家标准现状--led行业标准   严格地讲,不仅仅国内没有没有专门命
    发表于 11-19 11:12 1937次阅读

    UPS电源行业标准

    UPS电源行业标准的介绍
    发表于 11-10 16:43 76次下载
    UPS电源<b class='flag-5'>行业标准</b>

    水质溶解氧的测定方法有哪些,它的优缺点是什么

    目前我国的检测方法标准有:《水质 溶解氧的测定 碘量法》(GB7489-1987)、《水质 溶解氧的测定 电化学探头法》(HJ506-2009)和美国ASTM 标准(D888-05),前两种是中国国家和
    发表于 01-21 16:27 3148次阅读
    水质溶解氧的测定<b class='flag-5'>方法</b>有哪些,它的优缺点是什么

    基于RCA清洗系统的热模型以及清洗液的温度控制法

    在半导体制造工序的硅晶圆的清洗中,RCA清洗法被很多企业使用。RCA清洗方法是清洗硅片的行业标准方法,其中清洗溶液的温度控制对于稳定的清洗性能很重要,但它涉及困难,许多清洗溶液显示非线性和时变的放热
    发表于 04-15 14:55 1119次阅读
    基于RCA清洗系统的热模型以及清洗液的温度控制法

    了解基准电压温度漂移

    )基准。这对设计的真正意义是什么?这当然并不意味着如果我们将零件的温度提高 1°C,我们将通过温度系数改变输出电压。要了解发生了什么,必须记住,Maxim使用“box”方法指定其串联基准电压源。这种方法便于比较整个基准电压源系列,是行业
    的头像 发表于 01-17 10:49 2820次阅读
    了解基准电压温度漂移