0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

M1 GPU性能:集成王者,独立CPU的竞争对手

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-11-18 14:47 次阅读

上周,苹果公司发布了基于他们新Apple Silicon M1 SoC芯片打造新Mac产品,这个新闻在行业内引起了轰动,因为这标志着苹果正式开启了从Intel的x86 CPU过渡到该公司自己基于Arm架构设计的内部产品的两年计划第一步。

在发布会期间,我们根据该公司已经发布的Apple A14芯片(在新一代iPhone 12手机中使用)撰写了一篇详尽的文章,当中包括对Apple的新Firestorm内核的微体系结构的深入研究,这些内核同时为A14和新的Apple Silicon M1提供动力,如果您还没有机会看的话,我建议您阅读 《深度解读苹果M1芯片》 。

几天以来,我们已经能够接触到首批Apple Silicon M1设备之一:全新的Mac mini 2020版本。在上周的分析文章中,我们基于A14得出了数字,而这次,我们根据实际的新高功率设计测量了实际性能。我们没有很多时间,但是我们将为您带来与新的Apple Silicon M1相关的关键数据点。

Apple Silicon M1:Firestorm内核的3.2GHz和约20-24W TDP?

在Apple的演示文稿中,缺少芯片时钟频率的实际细节以及可以保持最高性能的TDP是他们的一贯风格。

但我们可以确认,在单线程工作负载中,Apple的Firestorm内核现在的时钟频率为3.2GHz,比Apple A14的3GHz频率提高了6.66%。只要有散热空间,此时钟也适用于所有内核负载,除了4个3.2GHz性能内核以外,我们在2064MHz处还可以看到4个Thunde效率内核,这也比A14上的1823MHz高出很多。

除了四个高性能的Firestorm核心之外,M1还包括四个Icestorm核心,旨在降低闲置功率并提高电池供电情境下的电源效率。4个性能内核和4个效率内核都可以同时激活,这意味着这是8内核SoC,尽管所有内核的性能吞吐量并不相同。

发布会期间最大的问题是这些设计的功耗。苹果已经提供了包括性能和功率轴在内的几张图表,但是我们缺乏比较数据来得出正确的结论。

由于我们可以使用Mac mini而不是Macbook,因此这意味着设备上的功率测量非常简单,因为我们只需将仪表连接到设备的AC输入即可。值得一提的是,由于我们在这里测量的是交流电源,因此功率数字不能直接与电池供电的设备相提并论,因为Mac mini的电源会带来比其他设备更大的效率损失。

尤其重要的是要记住,我们通常谈到的处理器中的TDP数实际上只是此处提供的数字的一个子集,因为除了SoC,我们还在测量DRAM和电压调节开销,而这并不是包含在TDP数据中,也不包括笔记本电脑上的典型封装电源读数。

从空闲的Mac mini处于默认状态开始,我们把打开电源后的设备看作空闲状态,在通过HDMI连接到2560p144显示器,Wi-Fi 6和鼠标和键盘,我们看到的设备总功率为4.2W。鉴于我们正在测量设备的交流电源,这在低负载下可能效率很低,这在很大程度上是有意义的,并且代表了一个很好的数字。

该闲置数据还用作后续测量的基准,在这些测量中我们计算“有功功率”(active power),这意味着我们通常采用的方法是测量总功率并减去闲置功率。

在3.2GHz Firestorm内核上的平均单线程工作负载(例如GCC代码编译)期间,我们看到设备功率高达10.5W,有功功率约为6.3W。有功功率与我们对更高频率的Firestorm内核的期望非常一致,并且对于Apple和M1来说是极有希望的。

在工作量更大的DRAM上,从而在Mac mini上的LPDDR4X级128位16GB DRAM上造成更大的功率损失,我们看到有功功率高达10.5W。有了这些数据,新的M1可能会给人留下深刻的印象,并且其展示能力还不到高端英特尔移动CPU的三分之一。

在多线程方案中,电源高度依赖于工作负载。在CPU利用率不高的内存密集型工作负载中,我们看到有功功率为18W,平均工作负载约为22W,在计算繁重的工作负载中峰值约为27W。这些数字通常是您希望与其他平台的“ TDP”进行比较的数字,尽管要再次进行比较,您需要进一步减去一些在Mac mini上测算的开销。最好的猜测是20至24W的范围。

最后,在GPU方面,我们看到GFXBench Aztec High的功耗降低了17.3W。这将包含大量的DRAM功耗,因此Apple GPU的功耗绝对是极低的功耗,并且远远小于CPU可以消耗的峰值功率。

存储差异

除了CPU和GPU上的其他内核外,M1与A14的主要区别还在于它运行在128位内存总线上,而不是在移动64位总线上。在8个16位内存通道和LPDDR4X-4266级内存中,这意味着M1达到了68.25GB / s的内存带宽峰值。

在内存延迟方面,我们发现M1较之A14(预期的)减少了,在128MB完全随机测试深度(full random test depth)下测量为96ns,而在A14上为102ns。

还需要注意的是性能核心的12MB L2缓存,尽管在这里苹果似乎仍在对单个核心可使用的数量进行分区,因为我们仍然看到8MB之后的延迟有所增加。

M1还包含一个较大的SLC缓存,芯片上的所有IP块都应可以访问该缓存,但我们不确定。不给过测试结果的确与A14相似,因此我们假设这是SoC上类似的16MB缓存块,因为某些访问模式超出了A14的访问范围,这在一定程度上是合理的较大的L2。

我们从未真正有机会进行测试的一个方面就是,苹果的核心在内存带宽方面到底有多出色。在M1内部,结果是突破性的:一次Firestorm可以实现高达58GB / s的内存读取速度,而内存写入速度则为33-36GB / s。最重要的是,根据您使用的是标量指令还是矢量指令,内存副本(memory copies)的传输速度可以高达60至62GB / s。单个Firestorm内核几乎可以使内存控制器饱和的事实令人震惊,因为这是我们以前在设计中从未见过的。

因为一个内核几乎可以利用整个内存带宽,所以让多个内核同时访问事物实际上并不会增加系统带宽,但是实际上由于拥塞会降低有效实现的总带宽。当在内存副本(memory copies)中同时使用性能核心和效率核心时,我特别指出了这一点——4个大核心以59GB / s的内存副本(memory copies)达到峰值,但是一旦添加了效率核心,它就会降至49GB / s,当所有内核都处于活动状态时,速度可降至46GB / s,这表明系统中某处中存在瓶颈。

除了增加时钟速度,增加L2之外,这种内存提升还很有可能是M1区别于A14之外的另一个关键点,并让其有能力与现有的x86厂商的竞争。

基准测试

由于我们使用Mac mini的时间很少,而且这不仅是一个macOS系统,而且是一个新的基于Arm64的macOS系统,因此我们无法使用我们通常使用的基准测试。在发布时,我们已经进行了各种可用的测试,以使我们对性能有一个大致的了解:

Cinebench是在macOS和Apple Silicon上初露头角的一个特定基准。在基于Cinema4D的首次基准测试中,我们看到苹果M1与市场上大部分的x86 CPU相比,拥有相当大的优势,但输给了Zen3和Tiger Lake CPU,后者似乎仍然具有优势。

值得注意的是,在x86模式下,Rosetta2基准测试的性能不仅能够跟上过去的Mac,而且还能胜过它们。

在多线程R23运行中,M1版本Mac具有绝对的领先优势。值得一提的是,我们正在尝试访问其他系统以收集更多数据,并希望进一步更新图表。

在浏览器基准测试中,Apple的CPU占据了主导地位,但是人们怀疑这是由于iPhone的CPU本身,还是仅归因于浏览器和浏览器引擎。现在可以在macOS和桌面Safari上运行,并且能够将数据与其他Intel Mac系统进行比较,我们可以得出这样的结论:性能优势归功于Apple的CPU设计。

Web浏览性能似乎是Apple CPU的头等大事,这是有道理的,因为它是移动SoC的杀手级工作量,也是日常生活中使用最多的工作量。

在Geekbench 5中,M1再次表现出色,因为它实际上领先于我们的性能数据。即使在以x86兼容模式运行时,M1与上一代高端CPU的顶级单线程性能相比不相伯仲,并且大大超过了Mac mini和Macbook的先前版本。

多线程性能取决于设计的内核数和功耗效率。M1在这里输给了2017年的15英寸Macbook Pro,它使用的Intel i7-7820HQ具有4核和8线程,得分翻倍。在收集数据点时,我们将添加更多的数据点。

M1 GPU性能:集成王者,独立CPU的竞争对手

从Intel切换到Apple芯片上,重点主要应该放在CPU内核上,对此,我们有充分的理由,但M1在GPU方面的表示不容忽视。像他们的CPU内核一样,苹果已经开发了自己的GPU技术已有多年了,随着向Apple Silicon的转变,这些GPU设计也首次出现在Mac上。从性能的角度来看,这带来的盖板边比苹果的CPU还要大。

苹果公司长期以来一直以要求GPU性能优于一般PC OEM厂商而闻名。尽管许多英特尔合作伙伴都很乐意甚至在部分15英寸笔记本电脑中都配备了具有Intel UHD图形和其他基准解决方案的系统,但苹果公司选择在其15英寸MacBook Pro中交付独立的GPU。而且,当他们无法在13英寸型号中安装独立GPU时,他们将Intel的高级Iris GPU配置与更大的GPU和片上eDRAM缓存结合使用,从而成为这些功能更强大的芯片的唯一常规客户。

因此,一段时间以来,苹果一直希望获得比英特尔默认提供的更好的GPU性能。通过切换到自己的芯片,Apple最终可以通过建立具有他们想要的所有GPU性能的笔记本电脑SoC来赚钱。

同时,与向Apple Silicon过渡的CPU方面不同,图形编程的高级性质意味着Apple几乎不依赖于开发人员,就可以立即准备通用应用程序以利用Apple的GPU。可以肯定的是,原生的CPU代码仍将产生更好的结果,因为几乎没有人听说过纯粹受GPU限制的工作负载,但是现有的Metal(甚至OpenGL)代码现在可以在Apple的GPU上运行,这意味着它立即使所有游戏和其他受GPU约束的工作负载受益。

至于M1 SoC的GPU,毫不奇怪,它看起来很像A14的GPU。但苹果对设计进行了一些调整,以适应Mac的敏感性(例如,各种GPU纹理和表面格式),但总的来说,差异是在API级别上抽象出来的。

总体而言,随着M1达到A14但更大,Apple已将其4核GPU设计从该SoC扩展到了M1的8核。但与CPU时钟速度相比,我们对GPU时钟速度的了解甚至更少。

因此,目前尚不清楚苹果是否真的提高了这些速度;但是如果GPU时钟没有提高,我会感到有些惊讶。总体而言,按照智能手机标准,A14的4核GPU设计已经非常强大,因此8核设计就更是如此。M1的集成GPU不仅旨在超越AMD和Intel的集成GPU,他们甚至还瞄准了独立GPU。

最后,应该指出的是,Apple为M1提供了两种不同的GPU配置。Mac Mini和MacBook Pro的芯片均启用了所有8个GPU内核。同时,对于Macbook Air,它取决于SKU:入门级型号具有7核配置,而更高级别的型号具有8核。这意味着入门级Air可获得最弱的GPU(比完整的M1落后约12%)。

让我们开始了解GPU性能,让我们从GFXBench 5.0开始。这也是我们笔记本电脑评测的常规基准之一,因此它为我们提供了一个很好的机会,将基于M1的Mac Mini与Mac生态系统内外的各种其他CPU / GPU组合进行比较。

总体而言,这并不是一个完全公平的测试,因为Mac Mini是小型台式机,而不是笔记本电脑,但是由于M1是笔记本电脑专用芯片,因此至少可以使我们了解M1在达到最佳状态时的性能。

总体而言,M1的GPU在这里非常强大。在正常和高设置下,它都远远领先于其他集成GPU,甚至是独立的Radeon RX 560X。只有到了NVIDIA的GTX 1650更强的GPU时,M1才渐落下风。

顺便说一句,我还通过Rosetta自由运行了基准测试的x86版本,以了解性能损失。至少在GFXBenchAztec Ruins中没有。GPU的性能与本机二进制文件和二进制转换几乎完全相同。

最后,我们以完全愚蠢的合成基准快速浏览了更广阔的领域,我们有了3DMark Ice Storm Unlimited。由于Apple Silicon Macs能够运行iPhone / iPad应用程序,因此我们能够通过运行iOS版本首次在Mac上运行此基准测试。这是为OpenGL ES 2.0时代建立的非常古老的基准,但有趣的是它的性能甚至比GFXBench好。Mac Mini的性能恰好足以滑过配备GTX 1650的笔记本电脑,尽管这不会经常发生,但它显示了M1的强大功能。

为苹果新Mac的发布而更新的另一个GPU基准是BaseMark GPU。这不是我们的常规基准测试,因此我们手头上没有其他非Mac笔记本电脑的分数,但是它使我们可以更进一步地了解M1与其他Mac GPU产品的比较。

2020年的Mac Mini仍然领先宇2018年基于Intel的Mac Mini,就此而言,它也比配备Radeon Pro 560的2017年MacBook Pro至少快50%。当然,较新的MacBook Pro会做得更好,但是请记住,这是一个集成的GPU,整个芯片比MacBook Pro的CPU消耗的功率更少,因此不必担心独立的GPU。

最后,将理论付诸实践,我们有了《Rise of the Tomb Raider》。该游戏于2016年发布,具有适当的Mac端口和内置基准,使我们能够在游戏场景中查看M1并将其与其他Windows笔记本电脑进行比较。诚然,这款游戏的年龄稍大一些,但其性能要求与M1旨在提供的性能非常匹配。最后,应该指出的是,这是x86游戏,尚未移植到Arm上,因此游戏的CPU端通过Rosetta运行。

在我们的768p Value设置下,Mac Mini在这里提供了超过60fps的速度。它再次大大领先于2018年基于Intel的Mac Mini以及该堆栈中的所有其他集成GPU。即使是15英寸的MBP及其Radeon Pro 560仍然落后于Mac Mini 25%以上,Ryzen笔记本电脑和Radeon 560X最终要与Mac Mini保持一致。

同时,通过“发烧友”设置将事情提高到1080p时,发现基于M1的Mac Mini仍提供不到40fps的速度,并且比上述Ryzen + 560X系统高出20%以上。这确实使Mini远远落后于GTX 1650-Rosetta和常规API效率低下可能起了一定作用-但它表明了击败Apple集成GPU所需要的能力。Mac Mini以39.6fps的速度可以在1080p上以良好的图像质量设置进行播放,并且相当容易地降低分辨率或图像质量以使其恢复到60fps以上。全部在集成GPU上。

最终,这些基准测试非常有力地证明了M1的集成GPU将不辜负苹果公司在高性能GPU方面的声誉。苹果公司为Mac推出的首个Apple内置GPU的速度明显快于我们能够使用的任何集成GPU,并且无疑将为笔记本电脑的GPU性能树立新的高标准。

根据苹果自己的die照片,很明显,他们将M1模具的相当一部分用于GPU和相关的硬件上,其收益是可以与低端独立GPU媲美的GPU。鉴于M1只是未来的基线,苹果将需要更强大的GPU用于高端笔记本电脑和其余台式机,看到基线的GPU时苹果及其开发者生态系统可以做什么将非常有趣即使是最便宜的Mac,其性能也很高。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    454

    文章

    50488

    浏览量

    422254
  • iPhone
    +关注

    关注

    28

    文章

    13447

    浏览量

    201499
  • 苹果
    +关注

    关注

    61

    文章

    24353

    浏览量

    197006
  • Mac
    Mac
    +关注

    关注

    0

    文章

    1100

    浏览量

    51400
收藏 人收藏

    评论

    相关推荐

    微软将OpenAI列为竞争对手名单

    微软在其最新提交给美国证券交易委员会(SEC)的10-K文件中,正式将OpenAI列入其竞争对手名单,这一名单中还包括了亚马逊、谷歌和Meta等科技巨头。此举标志着微软对OpenAI在人工智能领域,特别是其ChatGPT聊天机器人及新推出的SearchGPT搜索引擎原型的快速崛起给予了高度关注。
    的头像 发表于 08-05 11:38 596次阅读

    Genius Tracker™ 安装速度远超竞争对手的单轴跟踪器

    来自第三方的时间研究表明 GameChange Solar 的 Genius Tracker™ 安装速度远超竞争对手的单轴跟踪器 现场研究表明,照比市场中其他三款有竞争力的 1P 跟踪器
    的头像 发表于 04-07 16:49 461次阅读

    M1芯片和M3芯片相差大吗

    M1芯片和M3芯片在性能和应用上确实存在一定的差异。
    的头像 发表于 03-13 16:41 2987次阅读

    m3芯片和m3pro芯片怎么选 苹果m1芯片和m3芯片区别在哪

    ,具有8核CPU和10核GPU,能够提供出色的计算能力和图形处理性能。对于日常使用、轻度游戏和一些基本的图形处理任务,M3芯片能够轻松应对,同时保持较低的功耗,为设备提供长久的续航能力
    的头像 发表于 03-12 17:24 3928次阅读

    M3芯片与M1芯片的比较

    M3芯片与M1处理器相比,在多个方面表现出显著优势。首先,M3芯片在架构上采用了更先进的制程技术,如T8103内核和N5P制程,使其具有更高的性能和更低的功耗。
    的头像 发表于 03-11 18:20 2969次阅读

    苹果M3芯片性能提升

    苹果在2023年发布的M3芯片系列,在CPU性能和效率内核方面相较于M1系列有了显著的提升。具体来说,M3
    的头像 发表于 03-11 17:13 1175次阅读

    M1芯片和M3芯片的区别

    M1芯片和M3芯片都是苹果自家研发的处理器,它们在性能和设计上各有特点。
    的头像 发表于 03-11 16:37 3324次阅读

    M1M2和M3芯片是什么意思

    M1M2和M3芯片都是苹果公司推出的自研处理器芯片,具有不同的特点和发布时间。
    的头像 发表于 03-08 15:51 5578次阅读

    外交部回应英伟达将华为认定为“最大竞争对手”!

    竞争对手还包括英特尔、超微、博通、高通、亚马逊和微软。 英伟达指出,华为在供应图形处理器(GPU)、中央处理器(CPU)等用于AI的芯片领域,都可与业界竞争。 报道称,值得注意
    的头像 发表于 02-29 14:40 641次阅读

    英伟达将华为认定为“最大竞争对手”的原因

    英伟达指出,华为在供应图形处理器(GPU)、中央处理器(CPU)等用于AI的芯片领域,都可与业界竞争
    的头像 发表于 02-27 11:11 952次阅读

    英伟达将华为认定为最大竞争对手

    近日,美国芯片巨头英伟达在提交给美国证券交易委员会的文件中,首次将中国科技巨头华为认定为在多个类别,包括AI芯片领域内的“最大竞争对手”。这一举动被分析家视为全球先进制程芯片格局正在发生变化的明显迹象。
    的头像 发表于 02-25 16:47 946次阅读

    英伟达CEO表示华为好公司 英伟达将华为认定为最大竞争对手

    英伟达CEO表示华为好公司 英伟达将华为认定为最大竞争对手 就在英伟达发布了超级亮眼的财报数据而暴涨拯救美国股市后,不可避免的会有人拿英伟达与华为去做对比。 英伟达将华为认定为最大竞争对手 英伟达在
    的头像 发表于 02-25 15:18 794次阅读

    英伟达在文件中首次明确指出最大的竞争对手

    英伟达公司在最新提交给美国证券交易委员会的文件中,首次明确将华为定位为其在人工智能芯片领域的最大竞争对手。这一声明引起了业界的广泛关注,也表明了人工智能芯片市场的激烈竞争和华为在这一领域取得的重要
    的头像 发表于 02-23 15:34 595次阅读

    英伟达首次将华为列为多个领域的最大竞争对手

    2月23日消息,据外媒报道,英伟达在周三提交给美国证交会的文件中,首次将华为列为包括人工智能(AI)芯片在内的多个领域的最大竞争对手
    的头像 发表于 02-23 13:37 1007次阅读

    英特尔愿意为竞争对手AMD等公司代工芯片

    尽管基辛格未给出详尽解答,但他透露了一些引人深思的见解。他指出,英特尔将会将其制程技术授权给一些竞争对手,同时也承认产品团队可能需要与其基于英特尔核心技术的竞争者展开直接竞争
    的头像 发表于 02-22 09:43 584次阅读