0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD CPU之路-Chiplets

Linux阅码场 来源:杂谈与闲话 2023-06-30 09:27 次阅读

AMD的ZEN架构出现一开始,就是定义一个基本原则,一个core的架构,从laptop到desktop到server,这个也符合2015年AMD的股价,基本上没有钱做其他的路线了,而它的金主Intel的确风光呀,收购FPGAAI公司,架构上,mobile,laptop,desktop,server上面都是百花齐放,每个方向至少两个不同的方向。记得我刚进Xilinx的时候,大家说Intel的FPGA的PCIE Gen4一直出不来,主要原因是Intel内部至少有两个team在做PCIE,一个做4.0, 一个做5.0.

这个一招鲜吃遍天的做法,已经被ARM玩得炉火纯青了。一个架构的design,可以在mobile,也可以在server上。当年死在沙滩上的calxeda就是这样的。

因此。对于第一代的ZEN的架构,在Desktop上的确获得很大的成功,但是在server上面让中国的头号云计算玩家甚是失望。一个core的架构,来通吃整个市场,需要通过power和clocking的控制来实现。在下图中,基本也就在Desktop实现了突破。

d2444bf4-16d9-11ee-962d-dac502259ad0.png

通过小die来提升良率,使用CCX进行互联,这个是没有免费午餐的。但是,AMD因为比较专一,在CCX的设计上的确是翻身了。

d2d7546c-16d9-11ee-962d-dac502259ad0.png

架构上面,和传统的单die的CPU设计也有区别。使用ARM架构常用的Core和IO 分离的架构。

d35c0bc6-16d9-11ee-962d-dac502259ad0.png

通过IF互联的代价也很明确,就是天生NUMA。这个也是AMD的系统优化一直强调的NPS (NUMA Nodes per Socket)。local 和remote 之间的差距有点不忍直视。但是,既然走了这一步,AMD拼命加L3 cache的行为就说明他们还是明白“失之东隅 收之桑榆”的祖训的。

d3893146-16d9-11ee-962d-dac502259ad0.png

本文的重点是Chiplets,在AMD ISCA2021的paper 中,说明了Fabless公司面临的恶劣环境。

d3bfb360-16d9-11ee-962d-dac502259ad0.png

Mooer定律没死,但是的确老了,14nm之后的成本曲线变了。因此AMD早在14nm就开始改架构了。这个是AMD Zen成功的关键。

d3fe3d10-16d9-11ee-962d-dac502259ad0.png

Die的大小增加了10%,但是成本只有6成,漂亮。

这个时候,最大的32Core 已经被对手的28好不少了,但是AMD的已经看到了ARM 服务器那种夸张的数量。怎么才能拉垮等等呢?

TSMC的7nm是生逢其时。

d42b9c6a-16d9-11ee-962d-dac502259ad0.png

另一个关键的因素是剥离了IO,让IO 和Core独立发展。原因很简单,因为IO部分拿到的制成红利不多。

d4d28d18-16d9-11ee-962d-dac502259ad0.png

因此,在这个里面也充分说明了AMD精打细算的特质。在有人问到为什么要CPU上chiplets,而不是GPU时, 人家说了大实话,一个cpu的计算单元很大,8个少一个,就是损失了12%, 但是GPU里面的计算单元很很多,少几个没啥关系,不是有什么1080/1070/1060/1050/1040吗?

因此2代Zen真的是省上加省。

d56e1530-16d9-11ee-962d-dac502259ad0.png

同时,增加了IO Die,对于访存延时也有了改观。

d6006bc4-16d9-11ee-962d-dac502259ad0.png

虽然本地的延时大了4ns,但是remote的降低了,满足全世界人民的愿望:“不患寡,患不均”。大家都一起拉垮吧。

d67ece74-16d9-11ee-962d-dac502259ad0.png

因此,Zen2 在desktop,laptop和Server上做到了复兴,南海边的Hyperscale大获成功,据说他们的口号是“省一半”。

d6b8b918-16d9-11ee-962d-dac502259ad0.png

说到省,另一个没有想到的是Desktop 的io die也被拿去了做chipset。这个太高明了,以后ARM服务器出来之后,估计大部分的人IO Die可以直接做PCIE switch。

因此,在中国打压吃喝玩乐,单投硬科技的场景下,Chiplets成了一个香饽饽,这国人最迷信的“弯道超车”的白日梦中,chiplets一级本炒的火热了。好多没做过个芯片的,都要做先整个chiplets。但是chiplets真的好吗?请看AMD诚实的告白:

d7491a44-16d9-11ee-962d-dac502259ad0.png

What,你的Core不一样?

但是,AMD的用户和超市排队买便宜鸡蛋的大妈一样,我们有时间,有兴趣折腾。老板这个时候说了,便宜是硬道理,你们工程师自己去适配,这样不就锻炼了队伍吗? 同样,我这个系列就不放引用了,你们读了文章,还自己去找出处,也锻炼了大脑和翻墙的技巧。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1624

    文章

    21608

    浏览量

    601088
  • amd
    amd
    +关注

    关注

    25

    文章

    5415

    浏览量

    133780
  • TSMC
    +关注

    关注

    3

    文章

    177

    浏览量

    84426
  • chiplet
    +关注

    关注

    6

    文章

    416

    浏览量

    12541

原文标题:AMD CPU之路--Chiplets

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达计划2025年推出基于Arm架构的消费级CPU,挑战英特尔和AMD

    ,这款CPU将融合英伟达的CPU和GPU设计,专注于高端设备市场,并预计在2026年3月左右进一步扩大推广范围。这一举措标志着英伟达试图打破英特尔和AMDCPU市场的长期垄断地位。
    的头像 发表于 11-05 15:29 243次阅读

    英特尔与AMDCPU之争:单核性能与制造工艺的较量

     在过去,英特尔一直被视为国产CPU厂商难以企及的高峰。自酷睿时代起,英特尔便一直压制着AMD,如果不是受到美国反垄断法的制约,英特尔或许早已将AMD击败。
    的头像 发表于 11-05 11:15 179次阅读

    AMD全新处理器扩大数据中心CPU的领先地位

    在Computex 2024 开幕主题演讲上,AMD 详细介绍了全新的 CPU、NPU 和 GPU 领先架构,为从数据中心到个人电脑的端到端 AI 基础架构带来强大算力。AMD预览了将于 2024
    的头像 发表于 09-19 11:01 439次阅读

    AMD将推出Zen5架构CPU,效能比Zen4快40%

    AMD的Zen 5 CPU架构采用了台积电的3纳米制程。虽然目前关于Zen 5 CPU的细节尚不清楚,但预计将提高性能效率,内建人工智能和机器学习优化,并重新管道化前端。据报道,单核心效能将提升15%,多核心效能将提升30%,准
    的头像 发表于 08-08 14:25 432次阅读

    AMD重磅发布新一代AI PC芯片

    AMD CEO苏姿丰于近日在台北国际电脑展(COMPUTEX)上亮相,首次发布了AMD Zen 5系列的下一代高效能运算CPU——“Ryzen 9 9950X”。这款处理器不仅挑战了全球运算速度最快的
    的头像 发表于 06-05 11:01 752次阅读

    AMD推出全新AMD锐龙和EPYC处理器,扩大数据中心和PC领域领先地位

    ——下一代 AMD EPYC 处理器将扩大数据中心 CPU 的领先地位 ——全新 AMD 锐龙 AI 300 系列笔记本电脑和 AMD 锐龙 9000 系列台式机处理器为 Copilo
    的头像 发表于 06-04 19:21 934次阅读
    <b class='flag-5'>AMD</b>推出全新<b class='flag-5'>AMD</b>锐龙和EPYC处理器,扩大数据中心和PC领域领先地位

    AMD CPU业务稳步增长,预测再迎两位数增长

    在摩根大通全球科技、媒体和传播大会上,AMD执行副总裁兼首席财务官Jean Hu分享了公司的最新业绩。她表示,AMD在GPU以及个人电脑和笔记本电脑CPU方面均实现了稳步增长,同时在全球服务器
    的头像 发表于 05-29 11:09 491次阅读

    超微发布新款AMD H13代CPU服务器产品

    超微(Supermicro)近日宣布推出全新AMD H13代CPU服务器产品系列,再度巩固其在人工智能、云技术、存储和5G/边缘计算领域的领先地位。此次新品在性能和效率上均实现了卓越平衡,搭载AMD EPYC 4004系列处理器
    的头像 发表于 05-28 10:30 679次阅读

    AMD Strix Point CPU样品曝光,性能媲美英特尔酷睿i7-13700HX

    据@9550Pro(HXL)发布的推文透露,Blender基准测试结果展示了AMD Strix Point CPU工程样品,由4个性能核心与8个效率核心组成。
    的头像 发表于 05-17 14:45 632次阅读

    Nvidia与AMD新芯片,突破PCIe瓶颈

    AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域,数据必须通过 PCI 接口从 CPU 域移动到 GPU 域(并返
    的头像 发表于 03-08 14:15 556次阅读
    Nvidia与<b class='flag-5'>AMD</b>新芯片,突破PCIe瓶颈

    2023年硬件趋势:英特尔消费端CPU领先,AMD工作站CPU领先

    这家总部位于美国华盛顿奥本市的定制计算机厂商表示:“我们看到,自 2021 年开始,客户对 AMD Ryzen 5000 系列 CPU 的认可度逐步提升,然而随着 Intel 第 12 代 Alder Lake 芯片登场,AMD
    的头像 发表于 03-06 14:07 762次阅读

    值得入手的AMD Radeon 显卡推荐—— AMD Radeon RX 7900 XT

    结合5nm和6nm工艺节点,采用先进的小芯片(Chiplets)设计,全新的计算单元和第二代AMD高速缓存技术,相比AMD RDNA 2架构的每瓦性能提高54%;
    的头像 发表于 01-04 16:27 1221次阅读
    值得入手的<b class='flag-5'>AMD</b> Radeon 显卡推荐—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    深入分析AMD MI300A的规格和设计方案

    MI300A 与 H100 SXM,同样是 APU(CPU + GPU)与仅 GPU 的比较,AMD 认为其芯片处于大致水平,但包含 CPU
    发表于 12-21 14:41 1932次阅读
    深入分析<b class='flag-5'>AMD</b> MI300A的规格和设计方案

    AMD Instinct加速器、AMD EPYC处理器为Microsoft带来全新AI和计算能力

    VM —   近日,在Microsoft Ignite全球技术大会上,AMD和Microsoft共同展示了包括即将到来的AMD Instinct加速器、AMD EPYC(霄龙) CPU
    的头像 发表于 12-04 13:54 566次阅读

    AMD扩展其第三代AMD EPYC处理器家族并推出6款全新产品

    AMD加强广受好评的第三代EPYC CPU产品组合,为支持主要业务基础设施的服务器提供性能和能效— —包括Cisco、Dell Technologies、Gigabyte、HPE、Lenovo
    的头像 发表于 11-11 10:37 1266次阅读