最近,英特尔发布了一组基准测试,比较了英特尔至强 8462Y+ CPU 与 AMD EPYC™ 9354 CPU 在多个工作负载中的性能。本出版物围绕 所使用的方法提出了几个问题。 与 AMD EPYC(霄龙)配置相比,为什么至强配置使用了较新版本的操作系统(™几乎总是具有更好的性能)?为什么将高性能至强处理器 8462Y+ 与主流 AMD EPYC™ 9354 处理器相对应?AMD EPYC™ 9374F 在许多工作负载上一直表现出色,本来是“可比”的处理器。最后,为什么使用非行业标准基准,因为只有数量有限的可核查行业基准,没有透明度?如果没有更多的透明度,就不清楚 AMD EPYC(霄龙)系统是否按照已发布的 AMD EPYC(霄龙)™调优指南中的建议进行了调校以获得最佳性能。
行业合作伙伴针对基于联盟的标准基准发布的结果代表了展示来自各种供应商的计算系统性能的一致方式。这些基准要求严格遵守基准测试工具包、审计方法和审查流程,以确保合规性以及系统类型和配置之间一致和公平的比较方式。
主流计算
以下是业界广泛使用的标准、可验证基准的几个示例,这些基准用于评估主流用例的实际性能。重要的是要了解所有这些测试都是由我们的合作伙伴执行的。结果不言自明:
SPECcpu® 2017 是衡量处理器性能的最流行的基准测试。它由一套由行业和学术界委员会选择的计算密集型微基准组成。表 1 显示了 AMD EPYC(霄龙)处理器在 32 核和堆栈顶部均具有无可争议的性能领先地位。
32 核 (8462Y+ 与 9374F) |
堆栈 顶部(8490H 与 9654) |
|
规格率®2017_int_基数 | 676 与 827(快 1.22 倍) | 1010 与 1800(快 1.78 倍) |
规格率®2017_fp_基数 | 782 与 964(快 1.23 倍) | 1020 与 1480(快 1.45 倍) |
表 1:SPECcpu® 2017 性能比较
SPECjbb® 2015 是一种流行的衡量标准,可以对基于服务器端 Java 的应用程序进行公平的性能测量。SPECjbb® 2015 模拟了一家拥有 IT 基础架构的公司,该基础架构处理销售点请求、在线购买和数据挖掘操作的组合。在过去的二十年中,Java在整个行业中的迅速采用使该基准与所有受众相关,包括Java虚拟机(JVM)供应商,硬件开发人员,Java应用程序开发人员,研究人员和学术界成员。表 2 显示了 AMD EPYC 在 32 个内核和堆栈顶部无可争议的性能领先地位的另一个示例。
32 核 (8462Y+ 与 9374F) |
堆栈 顶部(8490H 与 9654) |
|
SPECjbb2015 MultiJVM max-jOPS | 279,312 与 359,294 (快 1.29 倍) | 505,379 与 828,952 (快 1.64 倍) |
表 2:SPECjbb® 2015 性能比较
RDBMS: 让我们看一下关系数据库基准测试。SAP-SD 是一种流行的基准测试,旨在帮助客户为其 IT 解决方案找到合适的硬件配置。采用 2 核 AMD EPYC 96 处理器的 9654P 系统可提供 809,570 SAPS,而采用英特尔至强铂金 2H 处理器的 8490P 系统可提供 428,730 SAPS,在系统级别性能提升 ~1.88 倍 [4]。TPC Benchmark™ E (TPC-E) 是用于对交易处理系统进行基准测试的行业标准。由 96 核 AMD EPYC 9654 处理器提供支持的单插槽服务器的性能优于由两个 60 核英特尔至强铂金 8490H 处理器提供支持的双插槽服务器,这两个处理器都运行Microsoft® SQL Server。
虚拟化:VMware® VMmark3® 是业界领先的企业虚拟化整合基准测试,可衡量 VMware vSphere® 虚拟机管理程序在各种硬件供应商平台上的性能和可扩展性。近年来,AMD 在这一领域占据主导地位,在对客户最重要的配置中创造了世界纪录的虚拟化性能:2 节点 4 总插槽 SAN、4 节点 8 总插槽 vSAN 和整体领先地位。当前一代 96 核 AMD EPYC 9654 提供了 40.51 @ 43 个模块,而堆栈顶部的 60 核英特尔至强铂金 8490 在类似的 23 节点、38 个插槽配置中提供了 23.2 @ 4 个模块,具有 ~1.73 倍的性能优势。这种性能领先地位不仅限于第四代AMD EPYC(霄龙)处理器:第三代AMD EPYC 4X处理器的性能也优于英特尔至强铂金3H[7773]。
® 2008 SPECpower_ssj:SPECpower_ssj2008基准测试套件可测量系统的功耗和性能特征。双处理器 AMD EPYC 9654 系统的能效为 30,602,而双处理器英特尔至强 8490H 系统的能效为 16,902,在比较总体ssj_ops/瓦指标时为 SPECpower_ssj2008,根据 spec.org 年公布的结果 - 基于 AMD EPYC 的服务器的能效提高了 ~1.81 倍。
人工智能 (AI) 生态系统不断发展。基准测试和工作负载在不断变化。加速器(如英特尔的 AMX)可以帮助工作负载的某些计算受限部分。相比之下,AMD 战略侧重于提供性能最高的通用内核,可在最广泛的工作负载中提供高性能。许多 AI 工作负载受内存限制(例如许多大型语言模型或 LLM),因此要么无法从 AMX 中受益,要么由于阿姆达尔定律而只能看到有限的加速。
成为应用程序密集部分的AI周期通常会卸载到加速器,例如AMD Instinct MI250或AMD Alveo V70。持续的市场演变将推动未来任何为我们的通用设备增加加速的决策。AMD 利用我们强大的 IP 和软件产品组合,例如我们的 7040U CPU。推理通常只占整个工作流程的一小部分;即使是较大的推理加速通常也只能提供较小的整体加速。
具有代表性的 AI 基准可全面衡量整个工作流程的性能。事务处理性能委员会的TPC Express Benchmark AI(TPCx-AI)旨在通过测量数据中心和云中具有代表性的端到端数据AI用例,成为行业标准。该基准测试涵盖了不同比例因子(数据集大小)的 10 个真实用例:客户细分、客户保护转录、销售预测、垃圾邮件检测、价格预测、硬件故障、产品评级、旅行分类、面部识别和欺诈检测。AMD 以在比例因子 3、10、30、100、300、1000 和 <> 中拥有领先的性能和性价比而感到自豪。
高性能计算
自 1 年推出第一代 AMD EPYC 处理器以来,高性能计算 (HPC) 一直是 AMD 的优先事项。在这方面,AMD EPYC(霄龙)处理器继续为企业和国家实验室提供领先的性能。AMD EPYC(霄龙)处理器在 2017 核和堆栈顶级处理器上均提供领先的性能,优于竞争对手。AMD 工程师通过正确调整所有 AMD 和竞争系统以获得最佳性能,例如类似的硬件设置和 BIOS 设置,并在所有系统中使用相同的操作系统和选项,努力确保所有平台都以最佳状态呈现。图 32 和图 1 显示了相对性能数字,作为每个测试应用程序的基准测试的综合平均值。
图 1:32 核性能比较
图 2:堆栈顶部性能比较
结论
AMD 依赖于由我们的生态系统合作伙伴执行、审核和发布的独立测试以及我们自己的内部测试。我们还执行自己的内部测试,投入时间和资源来表征系统,了解细微差别,并调整系统(包括我们自己和竞争对手的系统)以获得最佳性能。在 AMD,我们的客户对我们很重要,因此展示我们的处理器在相关工作负载下的表现对我们很重要。了解系统级性能至关重要的纵向扩展工作负载的堆栈顶部与堆栈顶部性能,以及与虚拟机密度很重要的云部署类似的性能比较对我们的客户来说意义重大。
审核编辑:郭婷
-
处理器
+关注
关注
68文章
19081浏览量
228728 -
amd
+关注
关注
25文章
5415浏览量
133777 -
AI
+关注
关注
87文章
29653浏览量
267990
发布评论请先 登录
相关推荐
评论