0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于ARMv8A的处理器——Graviton系列

Linux阅码场 来源:Linux阅码场 作者:Linux阅码场 2022-07-01 10:04 次阅读

2011年ARM公司的年度技术会议TechCon发布了全新的ARMv8架构[1],同一年,在以色列,Nafea Bshara和Bilik Hrvoye从他们的前老板获得2000万美元的投资,创建了Annapurna Labs。四年之后的2015年,亚马逊用35亿美元收购了这家公司。Annapurna Labs从此成为亚马逊的一个部门,这个部门相继设计了3代基于ARMv8A的处理器——也就是Graviton系列。

话不多说,先上参数

583f029c-f8d3-11ec-ba43-dac502259ad0.png

数据整理:健哥。

原始地址:https://fvot4kwt4n.feishu.cn/sheets/shtcn69s9nbcvYxX0bAnDgxiAUb

Graviton3们,等等,这里为什么用们?因为Graviton3这颗“芯片”(Chip)里面是由7颗芯片(die)组成的。虽然没有召唤出神龙,Graviton3的引力吸引到了4个DDR控制器die(每个die又有两个DDR5通道)和两个PCIe5.0控制器die。

把多个die封装到一个芯片中的技术称为chiplet技术,这样的好处是,如果将来亚马逊有了更快的CPU,而周围的DDR和PCIe控制器不变,则不需要重新设计制造DDR和PCIe控制器芯片,可以把新的CPU和已有的控制器封装到一起。这样,系统设计可以更加灵活。前面表格的华为鲲鹏920,也采用了这项技术。

芯片整体性能方面,官方的说法是每个核心的性能至少快了25%。下面的SPEC CPU 2017测试也可以说明这一点。图中的蓝色是Graviton2,绿色是Graviton3。SPEC CPU是业内通行的测试CPU性能的benchmark,包括整数测试,浮点测试等等,大多数的用例都取自最终用户的应用,例如perl解释器,视频压缩,3D渲染等等[3]。

5880905e-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

Nginx的负载均衡测试里面,Graviton3比前一代好了一倍。

58b09092-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

对于Nodejs,则提高了40%

58d007e2-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

视频编码提高了50%

58f71814-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

机器学习提高了几乎150%

591c6ae2-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

由于亚马逊做了软硬件垂直优化,不光是芯片本身的迭代,整个服务器的结构也有改进,这次一个主板上(下图右侧)支持三颗Graviton3芯片。

594117de-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

最后,让我们“打开”芯片,看看里面的CPU。Graviton3使用了ARM Neoverse V1。V1主要是支持ARMv8.4的特性(上次说的苹果M2支持到ARMv8.5特性),包括MPAM,SVE,嵌套虚拟化等。

595db4f2-f8d3-11ec-ba43-dac502259ad0.png

来源:https://community.arm.com/arm-community-blogs/b/architectures-and-processors-blog/posts/neoverse-v1-platform-a-new-performance-tier-for-arm

ARMv8.4的MPAM是内存的分区和监控功能,通过Partition ID对cache的容量和内存带宽进行划分。SVE是ARM在NEON的下一代SIMD(单指令多数据)指令集,关于SVE指令,2020年的超级计算机排行榜的第一名的Fugaku,就是基于ARM架构并使用了SVE指令集。[4]

ARMv8.4还支持了安全世界的虚拟化(Secure EL2),平时咱们用的Linux/Android都运行在Normal World(非安全世界,和安全世界相对)。安全世界运行需要更高安全性的能力,例如手机的指纹识别,版权视频播放等等。安全世界的虚拟化就是允许安全世界运行多个安全操作系统

59932a7e-f8d3-11ec-ba43-dac502259ad0.png

来源:https://en.wikipedia.org/wiki/Bfloat16_floating-point_format

ARMv8.6的Bfloat16不仅支持了Bfloat16浮点类型,还支持了该类型的点积和矩阵运算,以及从单精度浮点(32位)转换到Bfloat16的命令。Bfloat16格式是由Google Brain团队开发的格式,如上图,指数有8位,小数有7位。该格式很适合机器学习使用。

59b3a4c0-f8d3-11ec-ba43-dac502259ad0.png

来源:AWS re:invent 2021

Graviton3的CPU性能如何呢?有大神做了详细的测试[5],健哥选了其中的时延测试。下图的Amphere Altra和Graviton2一样都采用了Neoverse N1,下图是二者和Graviton3的memory时延对比,可以看出Graviton3的L3 cache性能(下图虚线,第三个台阶)明显比另外两个处理器好。但是由于DDR5本身的延迟比DDR4大一些,再加上DDR5在另外的die上面,所以Graviton3的主内存时延比另外两个稍稍大一些(下图第四个台阶,图片的右上角)。

59d74ace-f8d3-11ec-ba43-dac502259ad0.png

Graviton3在亚马逊云服务上已经上线,一根豪华冰棍的钱(每小时15.5RMB)就能愉快的玩耍64个vCPU的虚拟机1小时,相比之下,1vCPU2G内存的虚拟机只需要每小时两毛四。64个CPU意味着单个Graviton3的芯片完全被你所用,系统cache和内存带宽都是你一个人的。

59f6898e-f8d3-11ec-ba43-dac502259ad0.png

对ARM架构和调测调优感兴趣的小伙伴可以进群咨询了解健哥的课程

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19172

    浏览量

    229189
  • 芯片
    +关注

    关注

    454

    文章

    50451

    浏览量

    421942
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9056

    浏览量

    366856

原文标题:从外到内揭开亚马逊的自研ARM芯片:Graviton3

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    全志T536系列处理器特性概述 集成RISC-V E907协处理器

    全志T536系列处理器是一款工业、智能应用领域的高性能处理器;全志T536系列处理器可以说是基于ARM架构设计,专为高效能、低功耗的嵌入式应
    的头像 发表于 11-18 15:21 370次阅读
    全志T536<b class='flag-5'>系列</b><b class='flag-5'>处理器</b>特性概述 集成RISC-V E907协<b class='flag-5'>处理器</b>

    AM3517/AM3505高性能ARM Cortex-A8处理器数据表

    电子发烧友网站提供《AM3517/AM3505高性能ARM Cortex-A8处理器数据表.pdf》资料免费下载
    发表于 08-08 14:13 0次下载
    AM3517/AM3505高性能ARM Cortex-<b class='flag-5'>A8</b>微<b class='flag-5'>处理器</b>数据表

    AMD的锐龙9000系列处理器将延后至8月发布

    国际媒体传来消息,AMD公司已正式向其全球合作伙伴宣布,原计划于7月31日面世的锐龙9000系列处理器将延后至8月发布。这一调整源自于AMD在最终品质检验阶段发现的首批生产批次未能全面符合其严苛的质量标准。
    的头像 发表于 07-25 14:24 654次阅读

    GITSATR 集特国产 商务台式机电脑龙芯3A6000处理器

    处理器
    GITSTAR 集特工控
    发布于 :2024年07月22日 15:52:19

    亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

    北京2024年7月15日 /美通社/ -- 亚马逊云科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2
    的头像 发表于 07-15 16:09 351次阅读

    亚马逊网络服务即将推出第四代Graviton处理器

    7月10日,雅虎财经独家报道了亚马逊网络服务(AWS)即将推出的重大技术进展——其第四代Graviton处理器,即Graviton4芯片。这一重要信息由AWS的计算与人工智能产品管理总监拉胡尔·库尔卡尼在德克萨斯州奥斯汀的亚马逊
    的头像 发表于 07-10 15:51 575次阅读

    嵌入式微处理器有哪几类 嵌入式微处理器包含哪些重要参数

    等。在本文中,我们将详细介绍嵌入式微处理器的几类以及包含的重要参数。 一、嵌入式微处理器的几类 通用微处理器 通用微处理器是指那些不专为嵌入式系统设计的
    的头像 发表于 05-04 14:58 836次阅读

    AMD EPYC 8004系列处理器优势介绍

    AMD EPYC 8004系列处理器就是专为单路平台设计的高能效处理器,它体积小巧,非常适合空间和功率有限的部署环境。
    发表于 04-15 11:30 349次阅读
    AMD EPYC 8004<b class='flag-5'>系列</b><b class='flag-5'>处理器</b>优势介绍

    国产兆芯主板GM9-6002采用KX-U6780A处理器#兆芯处理器

    处理器主板
    国产计算机小秦
    发布于 :2024年04月13日 13:58:31

    基于Arm®Cortex-A35的微处理器MA35H0系列规格书

    电子发烧友网站提供《基于Arm®Cortex-A35的微处理器MA35H0系列规格书.pdf》资料免费下载
    发表于 02-22 14:59 3次下载

    #芯圣车规级触摸微处理器 HC8AT3541系列

    处理器
    上海芯圣电子股份有限公司
    发布于 :2024年01月16日 10:14:09

    AMD将在CES展会上展出Ryzen嵌入式V2000A系列处理器

    Ryzen嵌入式V2000A系列处理器将为信息娱乐控制台到数字仪表和乘客显示等汽车数字座舱全方位增值。扩张的Ryzen嵌入式V2000A
    的头像 发表于 01-08 10:06 1125次阅读

    BlueNRG系列处理器实战经验简介

    BlueNRG 系列芯片从最早的一代 BlueNRG-MS 开始就支持协处理器模式。
    的头像 发表于 01-05 18:16 1796次阅读
    BlueNRG<b class='flag-5'>系列</b>协<b class='flag-5'>处理器</b>实战经验简介

    u-boot armv8链接脚本

    u-boot armv8链接脚本 在进行源码分析之前,首先看看u-boot的链接脚本,通过链接脚本可以从整体了解一个u-boot的组成,并且可以在启动分析中知道某些逻辑是在完成什么工作。 在
    的头像 发表于 12-07 11:19 612次阅读

    亚马逊推出Graviton4处理器及AI量子芯片Trainium2

    据介绍, Graviton4比前代性能提升 30%,内核数增加 50%,内存带宽增加 75%,可以帮助 Amazon EC2 云服务的各类工作负载提供最佳性价比和能效。这款处理器还对所有高速物理硬件接口加密来提高安全性。
    的头像 发表于 11-30 17:43 951次阅读