至少有两种(可能还有更多种)途径可以让Arm处理器在数据中心中与现有的Intel和AMD X86处理器竞争。
第一条途径,也是迄今为止大多数Arm阵型采用的途径,那就是基于Arm内核和相邻技术创建更好的CPU,最终使服务器的外观,气味和品味一直到管理控制器和外围设备或多或少像过去二十年来在数据中心中普遍使用的X86服务器。通过这条道路,差异化体现在总吞吐量,价格/性能以及对未来处理器设计的激进节奏上,英特尔近年来无法通过Xeons交付这些产品,而AMD在其前两代Epyc处理器上做得相当出色。
将Arm服务器带入数据中心的另一条路径(当然也较少走过)是采用低功率的Arm CPU并构建另一种系统,该系统不需要当今数据中心中标准的强大X86处理器,但可以仍然以较低的成本和更高的效率处理大量的分布式计算工作负载。这是一条固有的风险之路,在过去的多年里也有很多人讨论,我们现在也正在思考的关于微服务器与服务器权衡。但是在构建了一些试验性的Arm服务器以验证这些想法之后,Bamboo Systems正在从私募股权(而不是学术和政府资金)中筹集第一笔资金,并将尝试提出基于Arm处理器做低功耗的分布式系统的尝试。
Bamboo Systems并不是一家新公司,而是一家专注和资金雄厚的公司。该公司的前身是Kaleao,我们在2016年8月就谈到了这一点,当时曼彻斯特大学的计算机架构教授,前Arm的技术和系统总监John Goodacre从超扩展程序工作负载到包括HPC工作负载改变了他基于微服务器的集群设计,开启了一个称为EuroServer的项目。
三年多以前,Goodacre坚信开发出许多用于并行化超级计算应用程序的关键技术,包括用于跨集群共享工作的消息传递接口(MPI)协议和分区全局地址空间(PGAS)内存。寻址方案。这就可以使得无论运行什么工作负载,无论是在HPC中心还是超大规模生产者中,都必须将其集成到将来的百亿亿次系统的编程模型中。因为没有其他方法可以同时承载数百万个线程。
Goodacre和他的团队早在2014年就开始了EuroServer项目,该平台的许多构想以及其他一些项目被结合在一起,创建了一个名为KMAX的商业产品。现在,他们正在对自己的Bamboo系统进行更名,并长期致力于成为系统供应商,该系统供应商将在正确的时间出现在正确的位置,因为摩尔定律在接下来的十年中最终失效。
第一个KMAX系统于2017年交付,该公司于2014年4月解密了这些设计,我们在此处详细介绍。KMAX集群基于三星开发的相对适中的Exynos 7420处理器打造,该芯片三星为其智能手机创建的,当中包括了来自Arm的运行于2.1 GHz的四核Cortex-A57处理器以及运行于1.5 GHz的四核Cortex-A53。其中Cortex-A53内核用于系统和管理功能,只有Cortex-A57内核用于计算。Exynos 7420芯片采用三星本身的14纳米工艺制造,由它们支持低功耗DDR4主存储器,并且集成了Mali-T760 MP8 GPU。您可以基于他们一起做很多有趣的工作。
KMAX计算节点拥有四个Exynos 7420处理器,而该架构是Goodacre所谓的“完全融合”,因为该节点具有捆绑在其上的所有计算,存储和联网功能,并且重要的是使用FPGA,特别是Xilinx的Zync FPGA。它能够利用嵌入式网络支持跨节点的PGAS和MPI内存方案,并从CPU中卸载某些网络功能。每个刀片(blade)上都有两个KMAX节点,最多12个刀片可装入一个3U机箱,该机箱具有128个内核,64 GB内存和2 TB嵌入式闪存的聚合,可提供80 GB /秒的I / O带宽,在该机箱上每秒处理大约一千万次I / O操作。每个刀片都可以附加32 TB的NVM-Express闪存存储。
使用高密度KMAX-HD变体(比标准机架要深一点),单个KMAX机箱就可以完成两打Dell PowerEdge服务器的超大规模工作(缓存,Web服务等)(可以使用老式的服务器) ,而功耗为Xeon E5处理器的四分之一,成本仅为三分之一,而空间仅为八分之一。据推测,将于今年推出的下一代Bamboo Systems机器将达到或超过这些分数的倍数。
根据Goodacre的说法,数据中心消耗了当今世界3.5%的能源,并且预计在未来五到十年内,能源消耗量将增长3倍至5倍。虽然在这些预测上有一些非常大的误差线。但关键在于,这是毫无疑问的大量能源,更重要的是,数据中心将在今年取代航空业成为最大的温室气体排放来源,到2023年,数据中心的消耗量将是航空业的4倍至5倍。在美国或中国,这可能没什么大不了的,但是能源效率一直是欧洲计算的更大动力,这些数字将在欧洲产生更好的共鸣。(这在一定程度上也解释了为什么Arm像在嵌入式和手持设备上一样迅速发展,以及Goodacre为什么在他所从事的服务器上做出了开创性的工作。
“服务器业务是一个超过800亿美元的市场,这是一个巨大的市场,” Bamboo Systems的新任首席执行官Tony Craythorne提醒The Next Platform。Craythorne最近在数据管理软件制造商Komprise负责全球销售,并在Brocade Communications,Hitachi Data Systems和Nexsan负责部分业务。“我们都知道,英特尔处理器占据了服务器市场的绝大部分。但是在过去的几年中,有些事情发生了变化。软件设计已经从非常高效的C和C ++代码转变为效率低得多的解释语言(interpreted languages ),例如Go和Python,以及由容器(containers )和Kubernetes主导的软件堆栈。同时,人工智能工作负载(尤其是机器学习)给英特尔架构带来了极大的压力,因为它不是为运行那些应用程序而设计的。人们通过处理越来越多的计算来解决这些问题。
我们不知道真实情况,但是,如果Bamboo Systems援引的数字正确,那么数据中心的能耗增长速度将超过聚合数据中心计算的增长速度。正如Goodacre 和Craythorne所看到的那样,这是一个机会。更准确地说,这就是机会。
但是Bamboo Systems不能只是在KMAX原型机上打一个新标签就可以做到。该公司没有透露何时更新的微服务器将从三星处理器转移到一个未指定的,现成的Arm处理器,Goodacre说它“相当快”,然后暗示8核到16核之间的某个东西对于单个操作系统,映像可能是平衡计算容量,内存带宽以及功耗和散热的最佳选择。他补充说,
有些东西与由Amazon Web Services创建的原始16核Graviton处理器类似,但与新的64核Graviton2没有相似之处。这是他们的目标。Goodacre没透露它是什么芯片,而是说它已经在当今市场上出售。
Nvidia的Tegra“ Carmel” Arm芯片(嵌入在其“ Xavier” Jetson AGX自动驾驶汽车平台中)最高达到八个内核。Marvell Armada芯片甚至在Armada 8K和Armada XP高端版本中拥有四个核心。而高通Snapdragon 865的上面有八个“KRYO” 585核心。
高通芯片的可能性很高,但是英伟达是一种可能性,特别是对于需要一定数量的GPU内存的工作负载而言。根据计算需求,没有理由刀片不能同时具有这两种功能。(如果我们忘记了清单,这并不意味着它是详尽的清单。)
多年来,我们在The Next Platform上看到了许多有趣的微服务器风格的处理器和系统来回走动,而现在我们问了过去几年来的相同问题:为什么现在不行,为什么现在仍然可以工作呢?过去呢?
“我认为关键是您必须使软件相同,” Goodacre解释说。“人们实际上只将系统视为它们软件的制程,因此,如果软件相同,那么一切都好办很多。“
Goodacre和Craythorne都明白,企业需要花费一些时间来测试Bamboo系统架构中的想法,并在其堆栈中找到正确的应用程序进行测试,然后投入生产。因此,该公司将专注于机器学习和人工智能,物联网和边缘计算,智能存储,Web基础设施,内容交付和数据分析应用程序。
同样重要的是,将使客户能够轻松使用平台测试机器,以便他们能够最终发展为概念验证并投入生产。Bamboo Systems的目标是长期的,并且与其同名产品一样,它希望能够以稳定,有机的步伐扎根并传播。
该公司对我来说,对于经销商来说,在该系统中期望获得的利润要比X86服务器市场所能得到的利润要多得多。我们都知道,过去十年或更长时间里,谁在X86服务器利润中占了最大份额——英特尔。
最后一点:将Arm处理器带入服务器的第三种方式是AWS通过其Nitro SmartNIC来完成的,该方式从处理器上分担了存储和网络功能。而且,您可以将SmartNIC与上面提到的或强或弱的Arm处理器结合使用。
-
处理器
+关注
关注
68文章
19274浏览量
229734 -
ARM
+关注
关注
134文章
9091浏览量
367453 -
amd
+关注
关注
25文章
5467浏览量
134127
发布评论请先 登录
相关推荐
评论