192个自研核心，AmpereOne的绝对性能压制-电子发烧友网

电子发烧友网报道（文/周凯扬）在亚马逊、英伟达和阿里巴巴等厂商纷纷围绕Arm Neoverse架构打造服务器处理器之际，Ampere Computing选择了一条与众不同的路线，自研核心。近日，Ampere宣布推出全新的AmpereOne系列处理器，可配置多达192个核心，且这些都是基于Ampere自有IP打造的自研核心。

Ampere Altra到AmpereOne，Ampere的自研之路

凭借前两代Ampere Altra系列产品80核Ampere Altra和128核Ampere Altra Max，Ampere成了在Arm服务器CPU领域的先行者之一。主流的大型云服务厂商（CSP）都已经推出了基于这两款CPU的服务器，如京东云就在近日推出了其首款基于Arm架构的云主机，搭载的正是Ampere Altra Max CPU。

CSP厂商纷纷拥抱Arm的原因很简单，高并发、高算力和更低的价格，为上云提供了极具性价比的选择。但如何做好差异化，是每个Arm服务器CPU厂商都需要思考的问题，比如英伟达选择了与自己的GPU结合打造Grace Hopper这样的SuperChip。

而拥有Arm ISA架构授权的Ampere选择了从微架构上进一步创新，打造自研的Arm云原生核，从绝对性能和可扩展性上超越同类产品。单个AmpereOne CPU的可配置核心已经达到192个，比上一代的Ampere Altra Max多出了50%，内核数为业界最高。

这意味着基于AmpereOne CPU的单机架性能将再创新高，为了匹配新CPU强大计算能力，AmpereOne还采用了8通道DDR5、128通道PCIe 5.0和更大私有缓存的设计，断绝了内存带宽和I/O性能上出现瓶颈的可能。针对高速增长的云原生应用，AmpereOne还集成了一系列新特性，包括网格拥塞管理、细粒度电源管理和内存标签等。Ampere表示，AmpereOne将帮助该公司进一步扩大在每机架性能方面的优势。

Ampere首席产品官Jeff Wittich：“192 核是一个非常大的数字，比英特尔和 AMD 要多很多。用一个具体的场景来说明，在云环境中运行虚拟机时，用192核的AmpereOne对比96核的AMD Genoa，或者60核的英特尔Sapphire Rapids，AmpereOne每机架运行的虚拟机数量是AMD Genoa的2.9倍，是英特尔Sapphire Rapids的4.3倍。”

AmpereOne发力Chiplet与AI推理

得益于工艺的进步和架构的创新，AmpereOne能做到如此规格似乎并不意外，但能在Ampere Altra Max面世后的短时间内推出这样一个“性能怪兽”，其实也离不开在设计方法上的转变。从AmpereOne的架构可以看出，与此前Ampere Altra系列不同的是，新的处理器转为采用Chiplet设计。近来不少先进芯片设计中都采用了这一技术，电子发烧友网也就这一转变询问了Ampere，Chiplet究竟有何助力，是否加快了芯片设计周期？

Jeff Wittich指出：“综合而言，我们在Ampere中转为大量采用小芯片带来了许多的优势，其中第一点就是能够有更高的灵活度，第二点就是如问题中提到的，帮助我们加快了整个芯片设计周期。在采用了Chiplet架构之后，产品的TTM也会随之缩短，还可以提供更高的可扩展性，从而提供现代云原生CPU的最佳性能。第三，Chiplet拓扑的设计也可以使AmpereOne更轻易地实现内存到内核的访问，而不需要为处理器引入额外的HOPs。”

另外值得注意的一点是，在早前的Ampere Altra系列CPU中，虽然也可以用于AI推理，但从CSP已发布服务器的定位来看，其主要还是用于Web服务、视频编解码以及云游戏等非AI应用上。而此次发布的AmpereOne，则在AI计算上加大了力度。

AI推理性能对比 / Ampere

从性能对比上，我们可以看出AmpereOne在AI推理负载上的领先，比如在生成式AI和推荐算法上，AmpereOne的单机架性能是AMD EYPC 9654 Genoa的两倍或以上，但两者却有着近乎相同的系统功耗，AmpereOne的优势在此展现得一览无余。

这与Ampere自身的发展以及行业趋势也紧密相关，AI负载已经成为云端最大的算力需求之一。而Ampere除了解决了AI硬件的问题外，也在布局AI软件生态。比如2020年，Ampere收购了专注于打造AI软件的OnSpecta，通过软硬件协同优化，为AmpereOne提供卓越的AI性能，比如对BF16精度的支持等等。

解决性能与能效的矛盾

在Ampere公布今年的路线图时，创始人/董事长兼首席执行官Renée J. James表示：“Ampere已经向行业证明，击破单核性能与能耗之间的矛盾正是行业所有人都在寻找的新象限。在能耗与性能的坐标轴之中，朝坐标轴的右下方移动是行业发展的新常态，目的是实现更低的能耗和更高的性能。”

针对云计算的需求，在设计产品的过程中，Ampere借助Arm架构的优势，综合考量从核、SoC到等其他方面的因素，致力于实现每瓦性能、每机架性能的提升。对比x86架构的CPU，Ampere Altra系列的的云原生处理器可以实现每机架2.5倍的性能提升，降低能耗2.8倍，并仅占用1/3的空间。而新发布的AmpereOne将帮助Ampere进一步扩大领先优势。

Jeff Wittich表示：“其实我们Ampere Altra系列处理器已经提供了行业领先的单机架性能，在能效方面已经是行业标杆性的产品。不仅是在性能方面，在能效方面我们也是领先AMD和英特尔所有的产品，即使是他们近期发布的低功耗产品。”

写在最后
诚然，对于大部分服务器CPU而言，面向的客户都是CSP和服务器OEM厂商，而他们提高竞争力的方式之一即提供差异化的高质量方案。不少Arm服务器CPU，虽然都在设计上做了差异化，但计算核心的性能并未拉开太大差距。Ampere选择了自研云原生核的方式，既满足了更高性能的需求，也解决了他们的另一大痛点，可扩展性与规模化。

成立5年多来，Ampere，已经在x86垄断的服务器市场占领了一席之地。在一切背后，是Ampere 认为云需要一种从本质上而言完全不同的方法。随着所有的计算转移到云端，整个平台的云原生化趋势不可避免，而Ampere正在做的就是为云原生进行彻底的CPU创新。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ARM

ARM

+关注

关注
134

文章
9111

浏览量
368053
cpu

cpu

+关注

关注
68

文章
10882

浏览量
212251
AI

AI

+关注

关注
87

文章
31158

浏览量
269506
Ampere

Ampere

+关注

关注
1

文章
69

浏览量
4550

Ampere®发布新版AmpereOne®处理器，强化AI与云计算性能

Ampere®公司近期推出了其旗舰产品AmpereOne®处理器的新版本，这一新版本处理器配备了12个内存通道，进一步提升了性能。这一举动与Ampere在去年5月份公布的年度战略和产品路线图更新中

发表于 01-09 18:09 •298次阅读

Ampere发布最新192核12内存通道AmpereOne M处理器

AmpereOne 产品路线图，并围绕云和 AI 的可持续以及节能计算提供持续创新。最新 192 核 12 内存通道的AmpereOne M通过提供更高的内存带宽来扩展产品系列，许多应用都将从中获益，尤其是 AI。这也为 AI

发表于 01-09 13:44 •100次阅读

东风四款自研新能源动力上榜年度“十佳”

强劲“中国心”，创新“加速度”。东风汽车实现关键核心技术自主掌控，自研动力成为转型发展“新动力”，提升高质量发展“含金量”。

发表于 12-20 16:10 •245次阅读

苹果计划2025年起采用自研蓝牙Wi-Fi芯片

近日，据最新报道，苹果公司为了减少对博通(Broadcom)的依赖，并进一步提升其设备的性能和能效，已经制定了一项重要的芯片自研计划。据悉，从2025年开始，苹果将正式启用自

发表于 12-18 14:22 •357次阅读

龙芯自研显卡来了！性能看齐AMD热销显卡

在信息技术领域，显卡作为计算机图形处理的核心组件，其自主研发能力一直被视为衡量一个国家技术实力的重要标准。近日，龙芯科技宣布正在研发自家显卡——龙芯9A1000，这一消息在国产硬件领域引起了广泛关注

发表于 12-05 01:06 •414次阅读

龙芯<b class='flag-5'>自</b><b class='flag-5'>研</b>显卡来了！<b class='flag-5'>性能</b>看齐AMD热销显卡

Arm成功将Arm KleidiAI软件库集成到腾讯自研的Angel 机器学习框架

Arm 与腾讯携手合作，成功将 Arm KleidiAI 软件库集成到腾讯自研的 Angel 机器学习框架。借助 KleidiAI 解锁卓越性能、能效和可移植性，腾讯混元大模型能够实现更快

发表于 11-24 15:33 •720次阅读

苹果自研5G芯片或于明年亮相

苹果公司正加速推进其自研5G芯片的研发进程，有望最快在明年推出首款自研5G调制解调器。这一举措对高通而言，无疑构成了巨大的挑战。

发表于 11-12 15:24 •564次阅读

比亚迪最快于11月实现自研算法量产,推进智驾芯片自研进程

10月21日市场传出消息，比亚迪正计划整合其新技术院下的自研智能驾驶团队，目标是在今年11月实现自研智能驾驶算法的量产，并持续推进智能驾驶芯片的自

发表于 10-22 15:57 •900次阅读

国产DSP，自研指令集内核C2000，F28335、F280049、F28377

国产DSP，自研指令集内核架构，自研工具链，完美替代TI的 C2000系列产品，F280049、F28335、F28377 性能、主频、外设

发表于 09-26 13:56

苹果自研Wi-Fi芯片或明年商用,用于部分iPad

9月20日最新资讯显示，苹果公司在自研芯片领域的成就斐然，其标志性的A系列芯片在iPhone和iPad上持续多年引领性能巅峰，而自2020年起推出的M系列芯片更是成功助力Mac产品线完

发表于 09-20 16:23 •1203次阅读

国产车企自研智驾芯片加速落地，蔚来小鹏等领跑赛道

在智能汽车产业加速变革的浪潮中，中国车企正以前所未有的决心和速度推进核心技术自研，特别是在智能驾驶芯片这一关键领域，蔚来、小鹏等头部企业已迈出坚实步伐，自

发表于 07-11 16:20 •1224次阅读

Ampere下一代AmpereOne系列处理器将拥有256个核心

虽然训练 AI 需要超强大的 GPU 算力，但 AI 算法的执行首先需要超高效的芯片。就像 AmpereCPU，未来的 AmpereOne 将拥有不少于256个内核，其功率仅为350W。(原文转自 Adrian Branco 发

发表于 06-18 14:35 •551次阅读

理想汽车自研大模型Mind GPT通过国家备案

理想汽车近日宣布，其全自研的多模态认知大模型Mind GPT已正式通过国家《生成式人工智能服务管理暂行办法》备案，成为汽车行业中首个成功通过该备案的自研大模型。这一里程碑式的成就，彰显

发表于 03-29 11:05 •614次阅读

微软正在研发新型网卡，旨在提升自研AI芯片性能

微软近日被曝正在秘密研发一款高性能的新型网卡，这一创新旨在增强其自研的Maia AI服务器芯片的功能，并可能大幅度降低对外部芯片设计厂商如英伟达的依赖。据知情人士透露，这款网卡的设计思路与英伟达热销的ConnectX-7网卡有着

发表于 02-21 11:01 •772次阅读

英伟达缺货？OpenAI选择自研芯片

电子发烧友网报道（文/周凯扬）在生成式AI和大模型带来的AI洪流下，不少大厂都不约而同地选择了自研AI芯片。即便这意味着组建新的团队，花费大量的资金，但从长远发展的角度来看，自研芯片

发表于 01-30 00:51 •3754次阅读

搜索历史

192个自研核心，AmpereOne的绝对性能压制

评论

Ampere®发布新版AmpereOne®处理器，强化AI与云计算性能

Ampere发布最新192核12内存通道AmpereOne M处理器

东风四款自研新能源动力上榜年度“十佳”

苹果计划2025年起采用自研蓝牙Wi-Fi芯片

龙芯自研显卡来了！性能看齐AMD热销显卡

Arm成功将Arm KleidiAI软件库集成到腾讯自研的Angel 机器学习框架

苹果自研5G芯片或于明年亮相

比亚迪最快于11月实现自研算法量产,推进智驾芯片自研进程

国产DSP，自研指令集内核C2000，F28335、F280049、F28377

苹果自研Wi-Fi芯片或明年商用,用于部分iPad

国产车企自研智驾芯片加速落地，蔚来小鹏等领跑赛道

Ampere下一代AmpereOne系列处理器将拥有256个核心

理想汽车自研大模型Mind GPT通过国家备案

微软正在研发新型网卡，旨在提升自研AI芯片性能

英伟达缺货？OpenAI选择自研芯片