0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ntel I9的多核scalability是真的吗

Linux阅码场 来源:Linux阅码场 作者:宋宝华 2021-10-20 11:25 次阅读

昨天我们用Intel I9的10核,每个核2个threads的机器跑了内核的编译:

超线程SMT究竟可以快多少?

今天,我换一台机器,采用AMD Ryzen。

默认情况16核,每个核2个threads,共32个CPUs:

8d9e0e28-3101-11ec-82a8-dac502259ad0.png

下面编译内核:

8df6755e-3101-11ec-82a8-dac502259ad0.png

大约需要53秒。记得昨天用Intel I9 10核20线程需要2分钟30秒左右。

再来一遍:

8e5dca56-3101-11ec-82a8-dac502259ad0.png

这说明make clean, drop_caches后时间也差不多。51秒,53秒左右的正常抖动范围。

现在我们关闭smt,只保留16个CPU:

8eda8b0e-3101-11ec-82a8-dac502259ad0.png

具体的关闭方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下16个CPU,下面来编译:

8f52ff44-3101-11ec-82a8-dac502259ad0.png

时间57秒,相对于51、53秒,速度下降不到10%。

这说明超线程SMT对编译内核这个workload的性能的提升绝对没有达到100%,甚至都没有达到10%。

我们现在重新开启超线程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control

看一下哪个CPU和哪个CPU是thread sibling:

8fd104d4-3101-11ec-82a8-dac502259ad0.png

看起来CPU0和CPU16是一对,CPU1和CPU17是一对,依次类推。

刚才我们关闭SMT是把CPU16-CPU31全关了,只留下每对里面的1个CPU,也就是留下了CPU0-CPU15。

在开启SMT的时候(假设蓝色和红色是一个CORE里面的两个CPU):

9085d2f6-3101-11ec-82a8-dac502259ad0.png

在关闭SMT的时候,等于每对里面只留1个CPU:

现在我们换一种关法,一对对关,只留下8对,也就是8个core:

指令如下:

918b663e-3101-11ec-82a8-dac502259ad0.png

实现效果如下:

92315648-3101-11ec-82a8-dac502259ad0.png

再重新编译内核:

926acc0c-3101-11ec-82a8-dac502259ad0.png

现在耗时是1分21秒,相对于所有CPU全开,下降了很多,时间增大了59%,当然没有达到2倍。

再想想昨天的Intel I9,关闭5个完整核耗时是3分10秒,全开10核是2分30秒,Intel一半核工作和所有核同时工作的差距远不如AMD那么明显。

所以可以看出,就内核编译这个workload而言,AMD的16core相对于8core,性能的scale会更加成正比。当然AMD开关SMT,对内核编译这个workload而言,影响小于10%,而Intel I9的影响有14%。

很多童鞋昨天留言,说编译内核有一定的IO bound,另外提到link阶段是单线程,还有的童鞋说是Intel Turbo的影响,这些我们都认为是有一定道理的。但是,我始终坚信,profiling是检验猜想的唯一标准,后面有空再写一篇文章来profiling一些究竟是为什么。

这到底是为什么?牙膏厂的多核scalability究竟是不是骗纸?还是按摩店的部分核没有Intel部分核的威猛模式?「元芳,你怎么看?」

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5468

    浏览量

    134166
  • 内核
    +关注

    关注

    3

    文章

    1372

    浏览量

    40290
  • intel
    +关注

    关注

    19

    文章

    3482

    浏览量

    186001

原文标题:这到底是为什么?牙膏厂的多核scalability究竟是不是骗纸?还是按摩店的部分核没有Intel部分核的威猛模式?「元芳,你怎么看?」

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    多核CPU的优势是什么

    多核CPU(Central Processing Unit,中央处理器)作为现代计算机技术的重要里程碑,其优势在于显著提升了计算性能、多任务处理能力、系统稳定性以及能效比等多个方面。以下将详细阐述多核CPU的几大优势,并结合相关数据和背景进行说明。
    的头像 发表于 08-22 14:30 2737次阅读

    Intel 13/14代i9 K系列处理器不稳定,部分用户转向AMD

    自年初以来,Intel的13代与14代酷睿i9 K系列处理器持续遭受不稳定性的困扰,这一状况已引起广泛用户与业界的深切关注。尽管问题曝光已超过季度之久,Intel官方尚未能明确指出问题的核心
    的头像 发表于 07-16 15:01 1121次阅读

    求助,关于ESP32多核使用问题求解答

    关于esp32的多核使用,除了使用xTaskCreatePinnedToCore函数来控制线程跑的核心外能否有其他的实现比如: 现在有两个bin文件,每个核心同时跑不同的bin文件,这种是否能够实现。
    发表于 06-17 06:28

    TC3x多核使用与TC2x多核使用相比是否有任何限制?

    大家好,TC3x 多核使用与 TC2x 多核使用相比是否有任何限制? 举例说明:TC3x 是否不允许在不同内核运行的代码之间进行多内核共享数据交换?
    发表于 05-22 07:32

    risc-v多核芯片在AI方面的应用

    RISC-V多核芯片在AI方面的应用主要体现在其低功耗、低成本、灵活可扩展以及能够更好地适应AI算法的不同需求等特点上。 首先,RISC-V适合用于高效设计实现,其内核面积更小,功耗更低,使得它能
    发表于 04-28 09:20

    13代及14代酷睿i9系列高端CPU游戏崩溃问题引发关注

    4 月 10 日讯,亚马逊 ZDNet Korea 报告指出,近期多名电脑用户在采用英特尔第 13 和 14 代酷睿 i9 高端处理器玩游戏时遇到了崩溃现象,如万代南梦宫游戏《铁拳 8》PC 演示版虽然配备较大的内存和显存,但仍无法避免频繁崩溃。
    的头像 发表于 04-10 10:08 2163次阅读

    兆芯开先KX-7000处理器现身Geekbench,多核性能接近8代i5

     KX-7000在连续两次百项基准测试中,取得单核最高得分824分,多核最高得分3813分的优异表现,多核性能与第八代酷睿i5旗鼓相当。
    的头像 发表于 03-19 14:18 1273次阅读

    英特尔酷睿i9-14900KS确认发售,预购价较i9-14900K上涨27%

    据报道,中国香港零售商 SE Computer已确定于3月14日推出英特尔酷睿i9-14900KS处理器,据悉已开启预售,其预订价格相较i9-14900K提升约27%。
    的头像 发表于 03-10 11:24 1427次阅读

    多核异构通信框架(RPMsg-Lite)

    概要 随着科技的飞速发展,计算需求日益复杂和多样化,传统的单核处理器已难以满足所有应用场景的需求。在这样的背景下,异构多核系统应运而生,成为推动计算领域进步的重要力量。异构多核系统不仅提高了计算效率
    的头像 发表于 03-08 18:20 5520次阅读
    <b class='flag-5'>多核</b>异构通信框架(RPMsg-Lite)

    苹果M3芯片和英特尔酷睿i9处理器哪个强

    苹果M3芯片和英特尔酷睿i9处理器各有其优势,难以简单地说哪个更强。
    的头像 发表于 03-08 15:29 7372次阅读

    i.MX 9系列-启动时间测量方法应用指南

    电子发烧友网站提供《i.MX 9系列-启动时间测量方法应用指南.pdf》资料免费下载
    发表于 02-20 10:37 0次下载
    <b class='flag-5'>i</b>.MX <b class='flag-5'>9</b>系列-启动时间测量方法应用指南

    什么是多核多线程?多核多线程如何提高程序的运行效率?

    单线程无法充分利用多核处理器的并行计算能力。
    的头像 发表于 02-20 10:22 1361次阅读

    TC397A如何多核调试?

    TC397的开发板,想试一下多核调试,请问有相关历程或者文档吗,现在都默认一个核在跑
    发表于 02-19 08:08

    华硕天选5 Pro游戏本1月23日发布,搭载RTX4060独显,起售价8999元

    据华硕官方公布数据显示,在 CineBench R20 测试中,天选 5 Pro 搭载的旧版酷睿 i9-13980HX 分数分别为单核 803分与多核 11,000分,而新版酷睿 i9-14900HX 的分数则为单核 841分与
    的头像 发表于 01-18 10:20 9341次阅读

    首发i9-14900HX 华硕天选5 Pro详细评测报告

    简单说来,i9-14900HX其实就是移动版的i9-14900K,它拥有8 P-Core和16 E-Core,共16核心24线程,32MB二级缓存和36MB三级缓存。
    发表于 01-11 11:16 5346次阅读
    首发<b class='flag-5'>i9</b>-14900HX 华硕天选5 Pro详细评测报告