0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD能在服务器领域实现领跑吗

半导体产业纵横 来源:半导体产业纵横 作者:半导体产业纵横 2022-11-15 10:42 次阅读

AMD能在服务器领域实现领跑吗?

由于验证周期长,服务器行业转向新供应商的速度很慢。安全的选择是坚持现有的供应商,无论是几十年前的 IBM,还是现在的英特尔。不过,AMD表示“坚持使用至强并不安全”。

fd6b8160-6411-11ed-8abf-dac502259ad0.png

第四代 Epyc Genoa 的发布标志着 AMD 在大多数性能指标上连续三代击败英特尔。Rome和Milan让云玩家开始大量购买 AMD,而Genoa可能会征服剩余的大多数市场和终端用户。SemiAnalysis 认为,Genoa和Sapphire Rapids的差距大于Milan和Ice Lake之间的差距。这种差距只会持续扩大到 2024 年底,但可能会在 2025 年出现 Sierra Forrest 和 Granite Rapids之间减少。

fda2143c-6411-11ed-8abf-dac502259ad0.png

AMD 正在推出越来越多的 CPU 变体。虽然 CPU 用于通用工作负载,但针对各种终端市场的定制正在增加。在第 4 代中,有 4 个变体。Genoa是通用的和主流的。

Bergamo 适用于云原生工作负载。IO die 和平台与 Genoa 共享,所以很多方面都相似,只是将 Zen 4 核心替换为 Zen 4C 核心,它具有相同的核心架构和 L2 缓存,每个核心只有一半的 L3 缓存。Zen 4C 的内核布局以牺牲频率为代价实现密度最大化。

Genoa还将有另一个名为 Genoa X 的变体,用于“技术”。这是一个奇怪的定义,但它适用于计算流体动力学、EDA 和其他需要更多缓存的工作负载。Genoa X 将是 Genoa具有 3D V-Cache 和多个潜在的变体。

Siena是给电信公司和边缘的。由于较低的功率和资本支出需求,我们还会说它适用于某些企业部署。从内存到核心数量,Siena大概是Genoa或Bergamo的 1/2。

最后,AMD 的下一代被称为 Turin,预计将在 2024 年上半年推出。它有更多的系列和变体。

fdf1593e-6411-11ed-8abf-dac502259ad0.png

总结一下, Genoa 的性能是 Milan 的 2 倍左右,而功耗只有适度的增加。由于增加了 AVX512 和超大的内存带宽提升,浮点增益更大

fe2ffe00-6411-11ed-8abf-dac502259ad0.png

规格没有什么大的改变,96 个内核、12 个 DDR5 通道和 160 个 PCIe Gen 5 通道(其中 64 个支持 CXL)。附加 CXL 的内存加密对于多租户云架构的安全性至关重要。CXL 内存 ASIC/设备不需要支持来支持加密,这不依赖于任何特定的 ASIC。

fe5f2ae0-6411-11ed-8abf-dac502259ad0.png

Genoa 的核心是 Zen 4 核心。性能大幅提升,IPC 提高了 14%,由于 L2 大小增加了 2 倍,显著提高了频率和平均延迟。前端占 IPC 改进的 40%,加载/存储改进占 24%,分支预测占 20%,L2 缓存/执行引擎每个是 8%。

fe985f0e-6411-11ed-8abf-dac502259ad0.png

AVX512是一个浮点向量指令库。英特尔以 512 位宽实现它,但这也意味着它在芯片层面的成本太高,而且英特尔没有在客户端芯片上包含该功能。此外,当 AVX512 点亮时,芯片的时钟速度会下降,芯片上的其他工作负载也会受到影响。AMD 通过将其拆分为跨 256 位单元的多个周期,走了一条更加智能的路线。这意味着不存在noisy neighbor问题,并且芯片面积影响仍然很小。

fec424cc-6411-11ed-8abf-dac502259ad0.png

安全性总是很重要, AMD 比英特尔具有优势的多个核心和 SOC 级别的安全功能。最值得注意的一个与 SMT 或超线程有关。Ampere Computing 喜欢提出每个内核运行多个线程是不安全的论点。带有 SEV-SNP 的 AMD 正在应对这个问题。如果实现此功能,安全客户线程可以选择在共享核心上有活动的同级线程时不运行。这可以防止旁通道攻击,例如 Spectre 和 Meltdown。

feef1448-6411-11ed-8abf-dac502259ad0.png

随着第四代 Epyc 的推出,IO Die 可以说是一个更大、更重要的变化。它建立在 N6 进程节点上,而不是像 CPU 小芯片那样的 N5。IO 芯片现在得到了加强,可以通过一个更大的、具有更多层的封装与 12 个小芯片通信

另一个值得注意的点是插座完全重新设计。安装机制更坚固,引脚间距更窄,为 0.94 x 0.81mm。尺寸从 58mm x 75mm 增加到 72mm x 75mm。对于像 Unimicron 这样的公司来说,更大的封装和更多的层是一件大事

AMD 的 IO 可扩展性非常值得关注。他们使用具有组合功能的 SerDes。从本质上讲,这些 SerDes 可以具有多种特性,使得所连接的选项非常可配置。该平台可以配置 3 个或 Infinity 结构通道,从而在 2S 配置中实现可扩展的 PCIe 通道数。每台 2S 服务器可以有 3 个 Infinity 结构通道和 160 个 PCIe 通道以及另外 12 个用于平台的 PCIe 链路,或者用于平台的 4 个 IFIS、128 个 PCIe 和 12 个 PCIe。每个 16x PCIe 根联合体可以缩减为 9 个 PCIe 设备,其中 1 个 8x 设备 + 8 个 1x 设备。

ff6f6b66-6411-11ed-8abf-dac502259ad0.png

鉴于Genoa大幅提高 IO 速度,正确利用该带宽至关重要。增强的 AVIC 减少了虚拟化 IO 设备的开销。这可以实现更高的带宽利用率和更少的 CPU 开销。Milan有一个更早的版本,但它更像是原型。现在使用 Genoa,IO 设备具有接近原生的性能。使用运行 InfiniBand 的 Nvidia 的 Mellanox Connect X7 进行的测试。

ff99337e-6411-11ed-8abf-dac502259ad0.png

Genoa在内存成本方面进行了关键改进,这是服务器 BOM 的 50%,这一点不容小觑。

值得注意的是对 72 位和 80 位 DIMM 的支持。大多数服务器将使用 80 位 ECC,但一些超大规模服务器希望减少到 72 位。相对于非 ECC 内存所具有的 64 位,仍有一些 ECC 功能,但比广泛使用的关键任务 80 位要少。这里的优点是用于奇偶校验检查的 DRAM 裸片减少了 1 个。“有界故障”功能也有助于解决此问题,因为如果在存储设备中检测到错误,则可以映射这些问题。

另一个重要特征是双列与单列内存。Milan 和大多数 Intel 平台,双列内存对于最大化性能至关重要。例如,Milan有 25% 的性能增量。在Genoa,这一比例降至 4.5%。这是另一个可观的成本改进,因为可以使用更便宜的单列内存。

Genoa的内存延迟比Milan高,Genoa为 118ns,而Milan为 105ns。AMD 表示,其中只有 3ns 来自更大的 IO 芯片,Genoa为 73ns,而Milan为 70ns。大多数内存延迟影响来自 DDR5 内存设备本身。DDR5 上为 35ns,而 DDR4 上为 25ns。这是由于 DDR5 不成熟、更大的存储库大小以及架构中的其他变化导致的更宽松的时序。内存延迟影响很大,但 SOC 级别的微小增加令人惊讶。

ffff2828-6411-11ed-8abf-dac502259ad0.png

IO Die 到 Core Complex Die 的连接得到了极大的改进。每比特传输的功率降至2pj/bit 以下。作为参考,EMIB 声称为 ~0.5pj/bit。最值得注意的方面是有一个新的 GMI3-Wide 格式。对于客户Zen 4 和前几代 Zen 小芯片,IOD 和 CCD 之间有 1 个 GMI 链接。使用 Genoa,在较低的核心数、较低的 CCD SKU 中,可以将多个 GMI 链路连接到 CCD。这是可用于较低核心数 SKU 的带宽的大幅增加。具体来说,这将有助于关系数据库和高频 SKU,其中每核许可成本很高。

电源管理得到增强。Genoa 有 2 种基本的电源管理模式,性能确定性或电源确定性。由于热和硅的变化,不同芯片上的不同工作负载之间可能存在许多差异。考虑到制造涉及数千个工艺步骤,硅不是确定性的。

性能决定论适用于希望获得持续性能的公司。它在允许的情况下消耗更少的功率,并且性能保持稳定。大多数客户会选择此选项,因为稳定性至关重要。

功率确定性是为了保持功耗稳定并提高和降低性能。考虑到硅抽签、热预算和工作负载等因素,芯片将提高和降低时钟速度。

除了电源管理模式外,Genoa 芯片还有一个可配置的 TDP。峰值提升行为将根据选择的选项而有所不同。时钟提升基于可靠性和峰值功率传输。高活动工作负载将以较低的频率运行。考虑了系统和芯片裕量。与消费级平台相比,功率预算不会长期超出。TDP 只能超过 10 毫秒。

003ad8c8-6412-11ed-8abf-dac502259ad0.png

AMD 通常支持 CXL 1.1,但支持 Type 3 内存设备的 CXL 2.0。

006b20c8-6412-11ed-8abf-dac502259ad0.png

值得一提的是,CXL 的 64 个通道可以分成 16 个 4x 器件。Sapphire Rapids不具备 CXL 通道分叉的能力。如果一个连接 4x 或 8x CXL 设备,这将消耗所有 16 个通道。Emerald Rapids 修复了该功能,但那是一年之后的事情。虚拟机管理程序无法更改来宾的内存分配,这对于在云中使用 CXL 附加内存的用户来说是巨大的。

AMD 的性能支柱是每插槽性能领先、每核心性能领先、所有工作负载和细分市场的领先地位,以及 TCO 和可持续性方面的领先地位。

00aa354c-6412-11ed-8abf-dac502259ad0.png

中端 Genoa 芯片与 2 个高端 Xeon 芯片的 1 个比较最好地说明了这一点。AMD 具有更高的性能、更低的功耗、更低的 CPU 成本、更少的内核。

AMD 的领先优势是开创性的。需要注意的一件事是,当每个内核的软件许可成本开始发挥作用时,这种领先优势在 TCO 方面会进一步扩大。这在运行 VMMark 的企业基准测试中得到了最好的体现。VMMark 每个磁贴运行 19 个具有代表性的 VM,然后查看可以运行多少磁贴以及速度。Genoa速度更快,可以处理更多的虚拟机。

010862e8-6412-11ed-8abf-dac502259ad0.png

SKU 命名非常简单明了,每个数字都表示关键信息

01587c06-6412-11ed-8abf-dac502259ad0.png

AMD 使 SKU 堆栈保持简单。与英特尔不同,没有一堆 SKU 锁定功能。有3个通用类别和18个SKU。核心性能 (F)、核心密度和平衡/TCO 优化。他们基于 1 个插槽与 2 个插槽支持进行细分。每个核心的价格也保持相对平稳。

019133a2-6412-11ed-8abf-dac502259ad0.png

在 Genoa 中,AMD 在整数工作负载上的每核性能领先通常约为 50%,在浮点上则高达 96%,后者大部分是由于内存带宽和缓存。

01ca82a6-6412-11ed-8abf-dac502259ad0.png

SQL 基准测试值得注意,因为在一些数据库基准测试中,AMD 由于其较高的核心到核心延迟而落后。他们仍然会在其中许多方面落后,但在一些常用的方面差距正在缩小。Sapphire Rapids 的单片和 4 管芯高级封装方法的优势在于,这些海量关系数据库将大大降低内核之间的延迟。

01ff0c2e-6412-11ed-8abf-dac502259ad0.png

在 HPC 性能比较中,96C 显示它仍然受到内存带宽的限制,但 32C 与 32C 显示Genoa的带宽优势是巨大的。

02406b10-6412-11ed-8abf-dac502259ad0.png

服务器整合是这里的重头戏。

02918d7e-6412-11ed-8abf-dac502259ad0.png

如果使用 2P 与 2P 或 2P 与 1P 服务器,数字会有所不同,但结果是相似的。通常 3 个 CPU 合并为 1 个 CPU。

02e91d32-6412-11ed-8abf-dac502259ad0.png

过去,AMD面对着一些问题,如工作负载不会在其中扩展,一些应用程序甚至会崩溃。Genoa拥有如此多的核心,能够访问大多数软件 ISV,因此Genoa结束了过去时期大部分痛苦。

032392dc-6412-11ed-8abf-dac502259ad0.png

最后一个点是关于机密计算。机密计算意味着软件不需要信任拥有硬件的所有者,同时能够保证数据安全。静态和动态数据,加密是一个很好理解的答案,但在使用中,答案很复杂。虽然Genoa并没有完全实现机密计算的愿景,但它在该领域带来了许多创新,使其更加接近。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5511

    浏览量

    134900
  • 服务器
    +关注

    关注

    12

    文章

    9390

    浏览量

    86385

原文标题:详解AMD Genoa

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    独立服务器和云服务器哪个快一些?

    独立服务器和云服务器哪个快一些?在数字服务部署中,独立服务器与云服务器的速度差异并非绝对,需结合资源配置与应用场景综合判断。以下是UU云对独
    的头像 发表于 02-05 10:08 117次阅读

    双北斗校时服务器、双北斗授时服务器、双北斗对时服务器、双北斗NTP服务器

    双北斗时间服务器具有许多优势,使其成为时间同步领域的佼佼者。首先,北斗卫星导航系统具有高精度、高稳定性和高实时性的特点,为北斗时间服务器提供了可靠的时间源。其次,北斗时间服务器采用了先
    的头像 发表于 01-21 09:24 168次阅读
    双北斗校时<b class='flag-5'>服务器</b>、双北斗授时<b class='flag-5'>服务器</b>、双北斗对时<b class='flag-5'>服务器</b>、双北斗NTP<b class='flag-5'>服务器</b>

    联想发布基于第五代AMD EPYC处理服务器产品

    近日,联想携手AMD共同举办“异构智算,稳定高效——联想算力基础设施新品发布会”。本次发布会上,联想重磅发布8款基于第五代AMD EPYC处理服务器产品——联想问天、ThinkSy
    的头像 发表于 12-16 16:23 461次阅读

    负载均衡服务器服务器如何连接?

    负载均衡服务器服务器如何连接?负载均衡服务器服务器可通过多种方式连接,包括直接连接、交换机连接、路由连接以及云计算环境中的连接。小型网
    的头像 发表于 12-09 13:41 196次阅读

    独立服务器与云服务器的区别

    随着互联网技术的飞速发展,企业对于服务器的需求日益增加,而服务器市场也随之出现了多种类型的产品,其中最常见的是独立服务器和云服务器。这两种服务器
    的头像 发表于 10-12 14:34 386次阅读

    新加坡服务器如何实现免备案?

     新加坡服务器的免备案特性主要得益于其地理位置、网络架构以及政策环境。以下是对新加坡服务器实现免备案的具体原因分析,rak小编为您整理发布。
    的头像 发表于 09-24 10:26 213次阅读

    服务器是虚拟技术吗

    服务器是现代信息技术领域的一个重要组成部分,它利用了虚拟化技术,为用户提供了一种基于互联网的计算服务。不同于传统的物理服务器,云服务器提供
    的头像 发表于 09-13 10:17 409次阅读

    服务器可以用在哪些领域

    服务器可以用在哪些领域呢?
    的头像 发表于 08-26 11:09 654次阅读

    突破与解耦:Chiplet技术让AMD实现高性能计算与服务器领域复兴

     改变企业命运的前沿技术  本期Kiwi Talks 将讲述Chiplet技术是如何改变了一家企业的命运并逐步实现在高性能计算与数据中心领域的复兴。 当我们勇于承担可控的风险、积极寻求改变世界
    的头像 发表于 08-21 18:33 2228次阅读
    突破与解耦:Chiplet技术让<b class='flag-5'>AMD</b><b class='flag-5'>实现</b>高性能计算与<b class='flag-5'>服务器</b><b class='flag-5'>领域</b>复兴

    服务器和虚拟服务器的区别是什么

    服务器和虚拟服务器是两种常见的服务器类型,它们在很多方面有相似之处,但也有一些关键的区别。本文将详细介绍云服务器和虚拟服务器的区别,包括它
    的头像 发表于 07-02 09:48 1016次阅读

    ai服务器和通用服务器的区别在哪

    注重稳定性和可靠性,通常采用较为稳定的硬件配置。 1.1 CPU AI服务器通常采用高性能的CPU,如Intel Xeon或AMD EPYC等。这些CPU具有更多的核心和更高的主频,可以提供更高的计算能力。而通用服务器则更注重C
    的头像 发表于 07-02 09:46 1418次阅读

    超微发布新款AMD H13代CPU服务器产品

    超微(Supermicro)近日宣布推出全新AMD H13代CPU服务器产品系列,再度巩固其在人工智能、云技术、存储和5G/边缘计算领域的领先地位。此次新品在性能和效率上均实现了卓越平
    的头像 发表于 05-28 10:30 909次阅读

    RISC-V在服务器方面应用与发展前景

    实现显著增长。 然而,尽管RISC-V在服务器领域的应用和发展前景广阔,但仍然存在一些挑战需要克服,如生态系统的建设、与现有技术的兼容性问题等。因此,业界需要持续投入研发和创新,推动RISC-V在
    发表于 04-28 09:04

    服务器数据恢复—服务器硬盘灯显示红色,服务器崩溃的数据恢复案例

    一台服务器中有一组由多块硬盘组建的raid阵列,在运行过程中服务器突然崩溃,管理员检查服务器发现该服务器raid阵列中有两块硬盘的指示灯显示红色。于是,管理员重启
    的头像 发表于 03-15 11:17 583次阅读
    <b class='flag-5'>服务器</b>数据恢复—<b class='flag-5'>服务器</b>硬盘灯显示红色,<b class='flag-5'>服务器</b>崩溃的数据恢复案例

    服务器数据恢复—分享几个服务器数据恢复的案例

    服务器数据恢复案例之服务器raid6中3个磁盘离线导致阵列崩溃的数据恢复案例;服务器数据恢复案例之服务器RAID5两个磁盘指示灯显示红色导致服务器
    的头像 发表于 03-04 13:21 1314次阅读