ntel I9的多核scalability是真的吗-电子发烧友网

昨天我们用Intel I9的10核，每个核2个threads的机器跑了内核的编译：

超线程SMT究竟可以快多少？

今天，我换一台机器，采用AMD Ryzen。

默认情况16核，每个核2个threads，共32个CPUs：

下面编译内核：

大约需要53秒。记得昨天用Intel I9 10核20线程需要2分钟30秒左右。

再来一遍：

这说明make clean， drop_caches后时间也差不多。51秒，53秒左右的正常抖动范围。

现在我们关闭smt，只保留16个CPU：

具体的关闭方法就是：

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

这样只剩下16个CPU，下面来编译：

时间57秒，相对于51、53秒，速度下降不到10%。

这说明超线程SMT对编译内核这个workload的性能的提升绝对没有达到100%，甚至都没有达到10%。

我们现在重新开启超线程：

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control

看一下哪个CPU和哪个CPU是thread sibling：

看起来CPU0和CPU16是一对，CPU1和CPU17是一对，依次类推。

刚才我们关闭SMT是把CPU16-CPU31全关了，只留下每对里面的1个CPU，也就是留下了CPU0-CPU15。

在开启SMT的时候（假设蓝色和红色是一个CORE里面的两个CPU）：

在关闭SMT的时候，等于每对里面只留1个CPU：

现在我们换一种关法，一对对关，只留下8对，也就是8个core：

指令如下：

实现效果如下：

再重新编译内核：

现在耗时是1分21秒，相对于所有CPU全开，下降了很多，时间增大了59%，当然没有达到2倍。

再想想昨天的Intel I9，关闭5个完整核耗时是3分10秒，全开10核是2分30秒，Intel一半核工作和所有核同时工作的差距远不如AMD那么明显。

所以可以看出，就内核编译这个workload而言，AMD的16core相对于8core，性能的scale会更加成正比。当然AMD开关SMT，对内核编译这个workload而言，影响小于10%，而Intel I9的影响有14%。

很多童鞋昨天留言，说编译内核有一定的IO bound，另外提到link阶段是单线程，还有的童鞋说是Intel Turbo的影响，这些我们都认为是有一定道理的。但是，我始终坚信，profiling是检验猜想的唯一标准，后面有空再写一篇文章来profiling一些究竟是为什么。

这到底是为什么？牙膏厂的多核scalability究竟是不是骗纸？还是按摩店的部分核没有Intel部分核的威猛模式？「元芳，你怎么看？」

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

amd

amd

+关注

关注
25

文章
5468

浏览量
134166
内核

内核

+关注

关注
3

文章
1372

浏览量
40290
intel

intel

+关注

关注
19

文章
3482

浏览量
186001

原文标题：这到底是为什么？牙膏厂的多核scalability究竟是不是骗纸？还是按摩店的部分核没有Intel部分核的威猛模式？「元芳，你怎么看？」

文章出处：【微信号：LinuxDev，微信公众号：Linux阅码场】欢迎添加关注！文章转载请注明出处。

搜索历史

ntel I9的多核scalability是真的吗

评论

多核CPU的优势是什么

Intel 13/14代i9 K系列处理器不稳定,部分用户转向AMD

求助，关于ESP32多核使用问题求解答

TC3x多核使用与TC2x多核使用相比是否有任何限制？

risc-v多核芯片在AI方面的应用

13代及14代酷睿i9系列高端CPU游戏崩溃问题引发关注

兆芯开先KX-7000处理器现身Geekbench，多核性能接近8代i5

英特尔酷睿i9-14900KS确认发售，预购价较i9-14900K上涨27%

多核异构通信框架（RPMsg-Lite）

苹果M3芯片和英特尔酷睿i9处理器哪个强

i.MX 9系列-启动时间测量方法应用指南

什么是多核多线程？多核多线程如何提高程序的运行效率？

TC397A如何多核调试？

华硕天选5 Pro游戏本1月23日发布，搭载RTX4060独显，起售价8999元

首发i9-14900HX 华硕天选5 Pro详细评测报告