(文章来源:IT大嘴巴)
2019年8月,AMD对外发布了第二代EPYC(霄龙)处理器,也创造了迄今为止x86架构处理器的最高纪录——64核心。AMD也再次成为行业翘楚。得益于7nm工艺的加持,64核心的第二代EPYC(霄龙)处理器不但获得了大众的青睐,也让支持者们再一次喊出了"AMD,YES!"的口号。
除了网友的追捧之外,业界对于第二代EPYC(霄龙)处理器也给予了积极的肯定。在堪称高性能计算标杆的CCF全国高性能计算学术年会上,第二代EPYC(霄龙)处理器荣膺大会 "处理器产品创新奖" ,而高性能计算也正是这款处理器主打的应用领域之一,可谓是实至名归。
应该说,从发布到今天,在短短几个月的时间里,第二代EPYC(霄龙)处理器以强劲性能创造了140多项世界纪录,并赢得了行业的高度关注。伴随着AMD在成都、深圳等全国多地的宣讲与传播,越来越多的x86用户对第二代EPYC(霄龙)处理器给与了超高的关注度,也开始了不断的体验与测试。
那么,为什么第二代EPYC(霄龙)处理器能够在短短半年的时间里打下超高的人气,获得众多的关注?64核心处理器的价值在何处?对于企业级用户来说,他们最关心的安全、稳定、可靠等问题,AMD又是如何来保障的呢?下面我们就来看看AMD第二代EPYC(霄龙)处理器的行业领先之处。
刚刚我们提到了,第二代EPYC(霄龙)处理器是基于7nm工艺制造的,这也是当下最先进的处理器制造工艺。许多人可能好奇为什么AMD能够率先提供64核心的x86处理器,而它的老对手英特尔最高只能支持到56核心处理器,这其中很大一部分功劳就来自7nm工艺。
我们知道,越先进的工艺,代表晶体管的尺寸越低,面积越小,也意味着AMD能够在单位面积内提供更多的核心。相比之下,英特尔目前的工艺还仅限于14nm,自然在核心数量上难以与AMD展开竞争。单就这一点来说,AMD就在单处理器核心数量上占据了优势,而在云计算环境中,这部分优势也会转化为实际的性能差异(这一点我们后面会详细说)。
当然7nm带来的改进不止这些,这是全新设计的Zen2架构。在之前的“那不勒斯”系列产品中,AMD第一次采用了Zen架构,而如今的第二代EPYC(霄龙)处理器则是基于Zen2架构,相比老版本已经是翻天覆地的变化。这里我们看到的是处理器架构示意图,左侧的是老版本右侧的是新版本。一个最明显的区别就是,Zen架构从第一代的“四海一家”变成第二代的“八星伴月”。这更体现出了AMD在芯片设计思路上的转变。
在Zen2上,AMD使用了Chiplets小芯片的设计思路,通过模块化来组合不同核心的处理器。与以往我们常说的“胶水”不同,Chiplets设计本质上是把不同工艺、不同架构的芯片电路按需搭配,比单纯的胶水封装更有灵活性,当然复杂度也更高。
另一个巨大的变化就是AMD将IO核心单独整合成了一个Die,整合了内存控制器、PCIe控制器等IO单元,使其独立化。因为相对于计算核心来说,IO核心处于辅助的地位,所以在电气性能和功耗要求上更低一些,所以在这部分AMD采用的是14nm的工艺实现。
这种7+14的搭配就为Zen2架构提供了良好的灵活性。一方面,大小核心的设计使得处理器的制造工艺不必全部拘泥于7nm,在生产工艺和难度上的要求进一步降低;另外在分离之后,核心数量的增加就变得更为灵活,这一代产品提供了从8核心到64核心的超丰富选择,也正是得益于此。
如此看来,7nm无疑是第二代EPYC(霄龙)处理器的最大亮点,也是64核心得以实现的物理基础;而借助于7+14的搭配,AMD在保障工艺提升的同时最大限度的兼顾了生产工艺、价格和扩展性等诸多问题,也具备了更多的灵活性,这也足以证明在制程上“解放思想”的重要性。
在谈到处理器的时候,性能自然是大家最关注的话题,也是评判处理器价值的关键指标。对于企业级应用来说,如今云计算已经是整个产业发展的潮流,无论是公有云还是私有云亦或是混合云,在这其中VMware都是重要的存在,而针对VMware虚拟化的支持也是我们考察处理器的重要指标之一。
VMmark是VMware公司推出的基准测试工具,它可以模拟数据中心的常用操作,并以此评价虚拟化环境中多个负载的性能和扩展性,以帮助客户选择合适的虚拟化硬件平台。VMmark使用tile(每tile包含8台虚拟机)为基本单位,其整体测试得分由每个tile的虚拟化得分和虚拟化架构操作得分两部分组成,分数越高,意味着虚拟机服务响应越好,VMware虚拟化性能就越高。
在测试中,VMmark可以对每tile模拟不同工作负载,例如邮件服务器、社交网络、电子商务等,同时根据这些工作负载的服务质量确定每个tile的虚拟化得分;虚拟化架构操作是指类似虚拟机的复制和部署、动态迁移、动态存储迁移以及自动负载均衡等操作,VMmark对这些操作进行评价打分,然后将得到的虚拟化架构操作分数和每个tile的虚拟化得分相加,就得到了整体基准测试得分。
根据SPEC测试平台公布的VMMARK 3 VIRTUALIZATION测试项目结果,第二代EPYC(霄龙)处理器平台以12.78的成绩获得了第一名,超过竞争对手41.6%,这也就意味着如果在私有云的应用中,第二代EPYC(霄龙)处理器可以达到更好的性能表现,这也是多核心的力量使然。
也正因为如此,AMD在定位第二代EPYC(霄龙)处理器的时候一个重要应用就是虚拟化环境。我们知道目前许多云服务的付费方式都是基于核时实现的(即每核心/小时),越强大的核心对于用户来说越划算,因为可以在单位时间计算更多的内容;而对于服务商来说,越多的核心则可以支持更多的虚拟机,进而实现更多的盈利。因此,无论是从用户还是从服务商的角度,第二代EPYC(霄龙)处理器都是虚拟化应用的好选择。
同样的情况也发生在JAVA相关的测试当中。熟悉服务器的朋友一定知道,我们在服务器安装的时候不可或缺的就是要安装JAVA软件,而据统计目前已经有30亿台设备在使用JAVA软件或程序。换句话说,我们操作的手机、笔记本乃至于其他智能设备中,都有JAVA的身影,而对于JAVA支持的优劣也与我们的日常应用息息相关。
同样是SPEC测试平台公布的成绩显示,在SPECjbb 2015测试中,AMD在定位第二代EPYC(霄龙)处理器,具体说来就是64核心的AMD EPYC 7742以355121分的成绩创造了新的世界纪录,而且相比竞争对手的性能提升了82.9%。这是一个了不起的数字,也说明了64核心第二代EPYC(霄龙)处理器在性能上的独树一帜。
大数据测试中,第二代EPYC(霄龙)处理器相对与上一代也有了明显的提升,在TPC ExpressBenchmark HS (TPCx-HS)大数据基准测试中,EPYC(霄龙)7002 处理器相较上一代产品将性能提升了36.9%,并继续保持世界领先。
由此看来,新工艺、新架构为AMD第二代EPYC(霄龙)处理器带来了明显的性能提升,无论是核心数量的增加、单核心性能的增强都带来了性能的明显提升,这种提升不仅仅反应在测试程序中,在世界应用的云计算、HPC等环境下,也在发挥着重要的作用。
在文章开头,我们提到第二代EPYC(霄龙)处理器曾获得了高性能计算领域的"处理器产品创新奖",而高性能计算也恰恰是AMD瞄准的发力方向之一。一直以来,高性能计算都对计算性能有着极高的要求,而且处于性能需求的不饱和状态,因此无论是x86还是POWER亦或是其他计算平台,都在这个领域大展拳脚。一句话——无论白猫黑猫,抓住耗子就是好猫。
ESI集团是世界领先的虚拟工程软件及服务供应商,它旗下有款名为VPS的旗舰产品,主要是通过仿真的方式帮助设计师通过收集信息进行模拟和仿真,从而进行更好的决定,比如许多汽车的设计就需要借助于VPS来实现。但是如果要想实时看到设计中的静态、碰撞、安全、空气动力等情况,就需要一款性能出色的高性能计算机,而且对于性能的需求上不封顶。
这也恰恰是第二代EPYC(霄龙)处理器的优势所在。为此,设计人员也针对不同核心数量进行了测试,结果显示基于第二代EPYC(霄龙)处理器的集群在 ESI 虚拟性能解决方案的 Neon 和 Neon4M 模型测试中表现优异,性能始终处于领先地位,也保持了相对于竞争对手的性能优势。这种优势一方面得益于每核性能,但同样也包括了PCI-E 4.0的优势。这就证明,第二代EPYC(霄龙)处理器完全可以适应HPC应用,并且成效显著。
同样的情况也出现在公有云当中。刚刚我们提到了虚拟化,这种技术在私有云平台上应用很广;而如果扩展到公有云平台的话,更多人喜欢使用容器技术,比如业界领先的AWS。如今,AWS也选择第二代EPYC(霄龙)处理器作为基础平台,而基于平台的容器性能更为出色。
AmazonEC2是一种在云端提供安全、弹性计算能力的 Web 服务,其目的是帮助开发人员更加方便地进行 web 规模的云计算。在采用了第二代EPYC(霄龙)处理器之后,EC2的应用实例可以随着容器数量的提升实现线性增长。即便在CPU利用率较高的情况下 (>80%) ,也能处理繁重的 I/O 和内存任务,并且相比同类竞品在计算和内存成本上节约10%。
从架构到性能,从7nm到64核心,第二代EPYC(霄龙)处理器给我们带来了太多的惊喜,而且在云计算、大数据和HPC应用等多个场景中,它所带来的大幅度性能提升也让我们感觉耳目一新。更重要的是,我们看到AMD在生态建设中正在不断完善,包括AWS、微软Azure等云领域的投入以及与美国能源部、Oak Ridge 国家实验室和 Cray Inc. 公司合作,计划打造新一代百亿亿级超级计算机。
(责任编辑:fqj)
-
处理器
+关注
关注
68文章
19155浏览量
229062 -
amd
+关注
关注
25文章
5440浏览量
133918
发布评论请先 登录
相关推荐
评论