0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

192个自研核心,AmpereOne的绝对性能压制

安晟培半导体 来源:电子发烧友网 2023-06-13 15:03 次阅读

亚马逊英伟达和阿里巴巴等厂商纷纷围绕Arm Neoverse架构打造服务器处理器之际,Ampere Computing选择了一条与众不同的路线,自研核心。近日,Ampere宣布推出全新的AmpereOne系列处理器,可配置多达192个核心,且这些都是基于Ampere自有IP打造的自研核心。

Ampere Altra到AmpereOne,Ampere的自研之路

f249cb88-0985-11ee-962d-dac502259ad0.png

Ampere Altra与AmpereOne对比 / Ampere Computing 凭借前两代Ampere Altra系列产品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服务器CPU领域的先行者之一。主流的大型云服务厂商(CSP)都已经推出了基于这两款CPU的服务器,如京东云就在近日推出了其首款基于Arm架构的云主机,搭载的正是Ampere Altra Max CPU。 CSP厂商纷纷拥抱Arm的原因很简单,高并发、高算力和更低的价格,为上云提供了极具性价比的选择。但如何做好差异化,是每个Arm服务器CPU厂商都需要思考的问题,比如英伟达选择了与自己的GPU结合打造Grace Hopper这样的SuperChip。 而拥有Arm ISA架构授权的Ampere选择了从微架构上进一步创新,打造自研的Arm云原生核,从绝对性能和可扩展性上超越同类产品。单个AmpereOne CPU的可配置核心已经达到192个,比上一代的Ampere Altra Max多出了50%,内核数为业界最高。 这意味着基于AmpereOne CPU的单机架性能将再创新高,为了匹配新CPU强大计算能力,AmpereOne还采用了8通道DDR5、128通道PCIe 5.0和更大私有缓存的设计,断绝了内存带宽和I/O性能上出现瓶颈的可能。针对高速增长的云原生应用,AmpereOne还集成了一系列新特性,包括网格拥塞管理、细粒度电源管理和内存标签等。Ampere表示,AmpereOne将帮助该公司进一步扩大在每机架性能方面的优势。 Ampere首席产品官Jeff Wittich:“192 核是一个非常大的数字,比英特尔AMD 要多很多。用一个具体的场景来说明,在云环境中运行虚拟机时,用192核的AmpereOne对比96核的AMD Genoa,或者60核的英特尔Sapphire Rapids,AmpereOne每机架运行的虚拟机数量是AMD Genoa的2.9倍,是英特尔Sapphire Rapids的4.3倍。”

AmpereOne发力Chiplet与AI推理

得益于工艺的进步和架构的创新,AmpereOne能做到如此规格似乎并不意外,但能在Ampere Altra Max面世后的短时间内推出这样一个“性能怪兽”,其实也离不开在设计方法上的转变。从AmpereOne的架构可以看出,与此前Ampere Altra系列不同的是,新的处理器转为采用Chiplet设计。近来不少先进芯片设计中都采用了这一技术,电子发烧友网也就这一转变询问了Ampere,Chiplet究竟有何助力,是否加快了芯片设计周期? Jeff Wittich指出:“综合而言,我们在Ampere中转为大量采用小芯片带来了许多的优势,其中第一点就是能够有更高的灵活度,第二点就是如问题中提到的,帮助我们加快了整个芯片设计周期。在采用了Chiplet架构之后,产品的TTM也会随之缩短,还可以提供更高的可扩展性,从而提供现代云原生CPU的最佳性能。第三,Chiplet拓扑的设计也可以使AmpereOne更轻易地实现内存到内核的访问,而不需要为处理器引入额外的HOPs。” 另外值得注意的一点是,在早前的Ampere Altra系列CPU中,虽然也可以用于AI推理,但从CSP已发布服务器的定位来看,其主要还是用于Web服务、视频编解码以及云游戏等非AI应用上。而此次发布的AmpereOne,则在AI计算上加大了力度。

f29d8df4-0985-11ee-962d-dac502259ad0.png

AI推理性能对比 / Ampere 从性能对比上,我们可以看出AmpereOne在AI推理负载上的领先,比如在生成式AI和推荐算法上,AmpereOne的单机架性能是AMD EYPC 9654 Genoa的两倍或以上,但两者却有着近乎相同的系统功耗,AmpereOne的优势在此展现得一览无余。 这与Ampere自身的发展以及行业趋势也紧密相关,AI负载已经成为云端最大的算力需求之一。而Ampere除了解决了AI硬件的问题外,也在布局AI软件生态。比如2020年,Ampere收购了专注于打造AI软件的OnSpecta,通过软硬件协同优化,为AmpereOne提供卓越的AI性能,比如对BF16精度的支持等等。

解决性能与能效的矛盾

f2d2b5e2-0985-11ee-962d-dac502259ad0.png

服务器CPU的能效象限 / Ampere Computing 在Ampere公布今年的路线图时,创始人/董事长兼首席执行官Renée J. James表示:“Ampere已经向行业证明,击破单核性能与能耗之间的矛盾正是行业所有人都在寻找的新象限。在能耗与性能的坐标轴之中,朝坐标轴的右下方移动是行业发展的新常态,目的是实现更低的能耗和更高的性能。” 针对云计算的需求,在设计产品的过程中,Ampere借助Arm架构的优势,综合考量从核、SoC到其他方面的因素,致力于实现每瓦性能、每机架性能的提升。对比x86架构的CPU,Ampere Altra系列的的云原生处理器可以实现每机架2.5倍的性能提升,降低能耗2.8倍,并仅占用1/3的空间。而新发布的AmpereOne将帮助Ampere进一步扩大领先优势。 Jeff Wittich表示:“其实我们Ampere Altra系列处理器已经提供了行业领先的单机架性能,在能效方面已经是行业标杆性的产品。不仅是在性能方面,在能效方面我们也是领先AMD和英特尔所有的产品,即使是他们近期发布的低功耗产品。”

写在最后

诚然,对于大部分服务器CPU而言,面向的客户都是CSP和服务器OEM厂商,而他们提高竞争力的方式之一即提供差异化的高质量方案。不少Arm服务器CPU,虽然都在设计上做了差异化,但计算核心的性能并未拉开太大差距。Ampere选择了自研云原生核的方式,既满足了更高性能的需求,也解决了他们的另一大痛点,可扩展性与规模化。 成立5年多来,Ampere,已经在x86垄断的服务器市场占领了一席之地。在一切背后,是Ampere 认为云需要一种从本质上而言完全不同的方法。随着所有的计算转移到云端,整个平台的云原生化趋势不可避免,而Ampere正在做的就是为云原生进行彻底的CPU创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10696

    浏览量

    209301
  • OEM
    OEM
    +关注

    关注

    4

    文章

    397

    浏览量

    50117
  • 服务器
    +关注

    关注

    12

    文章

    8694

    浏览量

    84524

原文标题:媒体视角|192个自研核心,AmpereOne的绝对性能压制

文章出处:【微信号:AmpereComputing,微信公众号:安晟培半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    消息称小鹏汽车智驾芯片流片成功

    小鹏汽车近期传来振奋人心的消息,其自主研发的智能驾驶芯片已成功完成流片,标志着小鹏在核心技术领域迈出了坚实的一步。据知情人士透露,这款小鹏智驾芯片专为满足高度智能化的驾驶需求而生,采用先进的端到端大模型设计理念,构建了一套舱
    的头像 发表于 08-28 15:37 388次阅读

    国产车企智驾芯片加速落地,蔚来小鹏等领跑赛道

    在智能汽车产业加速变革的浪潮中,中国车企正以前所未有的决心和速度推进核心技术,特别是在智能驾驶芯片这一关键领域,蔚来、小鹏等头部企业已迈出坚实步伐,
    的头像 发表于 07-11 16:20 860次阅读

    Ampere下一代AmpereOne系列处理器将拥有256核心

    虽然训练 AI 需要超强大的 GPU 算力,但 AI 算法的执行首先需要超高效的芯片。就像 AmpereCPU,未来的 AmpereOne 将拥有不少于256内核,其功率仅为350W。(原文转 Adrian Branco 发
    的头像 发表于 06-18 14:35 422次阅读

    理想汽车大模型Mind GPT通过国家备案

    理想汽车近日宣布,其全的多模态认知大模型Mind GPT已正式通过国家《生成式人工智能服务管理暂行办法》备案,成为汽车行业中首个成功通过该备案的大模型。这一里程碑式的成就,彰显
    的头像 发表于 03-29 11:05 470次阅读

    微软正在研发新型网卡,旨在提升AI芯片性能

    微软近日被曝正在秘密研发一款高性能的新型网卡,这一创新旨在增强其的Maia AI服务器芯片的功能,并可能大幅度降低对外部芯片设计厂商如英伟达的依赖。据知情人士透露,这款网卡的设计思路与英伟达热销的ConnectX-7网卡有着
    的头像 发表于 02-21 11:01 597次阅读

    英伟达缺货?OpenAI选择芯片

     电子发烧友网报道(文/周凯扬)在生成式AI和大模型带来的AI洪流下,不少大厂都不约而同地选择了AI芯片。即便这意味着组建新的团队,花费大量的资金,但从长远发展的角度来看,芯片
    的头像 发表于 01-30 00:51 3544次阅读

    搭载潮汐架构,Find X7 将刷新芯片性能上限!

    OPPO 今日宣布 Find X7 将搭载潮汐架构,以芯片级性能解决方案为旗舰芯片平台带来刷新上限的极致能效表现。OPPO表示潮汐是地球上最强大的,也是永不枯竭的自然能量之一,寓意着这一创新
    发表于 01-03 11:18 331次阅读
    搭载<b class='flag-5'>自</b><b class='flag-5'>研</b>潮汐架构,Find X7 将刷新芯片<b class='flag-5'>性能</b>上限!

    苹果Wi-Fi芯片之路充满挑战

    据悉,苹果在5G调制解调器芯片上投入了大量资金,如今希望在Wi-Fi芯片上取得突破。然而,据报道,该项目一度陷入停顿,项目团队也进行了重新组织。同时,苹果与高通之间在5G调制解
    的头像 发表于 12-26 14:46 596次阅读

    从授权到内核,汽车MCU大厂倒戈RISC-V?

    CPU核心,而这一核心未来也将集成到瑞萨的32位MCU上。   率先开始授权RISC-V核心的瑞萨   尽管瑞萨宣布RISC-V
    的头像 发表于 12-05 00:20 1802次阅读
    从授权到<b class='flag-5'>自</b><b class='flag-5'>研</b>内核,汽车MCU大厂倒戈RISC-V?

    微软AI芯片与H100、特斯拉D1性能对比

    微软的多年投资显示,芯片对于在AI和云计算领域取得优势至关重要。芯片可以让微软从硬件中获得性能和价格优势,还可以避免微软过度依赖任何一家供应商。目前业界对英伟达AI芯片的争夺战,更加凸显了这个问题。
    发表于 11-22 15:38 495次阅读
    微软AI<b class='flag-5'>自</b><b class='flag-5'>研</b>芯片与H100、特斯拉D1<b class='flag-5'>性能</b>对比

    微软重磅推出AI芯片!

    根据微软官方消息,他们在最近举行的Microsoft Ignite全球技术大会上推出了两款人工智能芯片,并与AMD和英伟达展开合作,以推进人工智能和计算能力。
    的头像 发表于 11-16 18:24 1076次阅读

    什么是小鹏理解的全栈

    全栈能力为车企提供高效率,缩短20%的开发时间,减少60%座舱的开发成本,减少智能驾驶成本50%。
    的头像 发表于 10-27 10:57 849次阅读

    的regression脚本yrun都有哪些东西呢?

    yrun是处芯积律的regression脚本,yrun都有哪些东西呢?
    的头像 发表于 10-12 09:26 1231次阅读
    <b class='flag-5'>自</b><b class='flag-5'>研</b>的regression脚本yrun都有哪些东西呢?

    【求助】RK3568工控板,原厂SDK的Linux启动失败

    公司按照瑞芯微官方设计了一块3568工控板,主要的外设就原生两路GMAC外接了裕泰的8531SH,另外通过PCIE3X2外接了一PCIE网卡。 开发板回板后跟硬件的同事一起调试原厂的SDK
    发表于 10-09 08:29

    蔚来汽车芯片“杨戬”将于10月正式量产

    蔚来汽车芯片“杨戬”将于10月正式量产 在NIO IN 2023 蔚来创新科技日发布会上蔚来汽车芯片曝光,这颗蔚来汽车
    的头像 发表于 09-21 18:04 1952次阅读
    蔚来汽车<b class='flag-5'>自</b><b class='flag-5'>研</b>芯片“杨戬”将于10月正式量产