Linux中提高指令缓存命中率-电子发烧友网

提高指令缓存命中率

前面说的是数据缓存，现在看看指令缓存命中率该如何提高。

有一个数组array，数组元素内容为0-255之间的随机数：

int array[N];
for (i = 0; i < TESTN; i++) 
 array[i] = rand() % 256;

现在，要把数组中数字小于128的元素置为0，并且对数组排序。

大家应该都能想到，有两种方法：

先遍历数组，把小于128的元素置为0，然 后排序 。
先对数组排序 ， 再遍历数组 ，把小于128的元素置为0。

for(i = 0; i < N; i++) {
 if (array [i] < 128) 
  array[i] = 0;
}
sort(array, array +N);

先排序后遍历的速度会比较快，为什么？

因为在for循环中会执行很多次if分支判断语句，而CPU拥有分支预测器。

如果分支预测器可以预测接下来要执行的分支（执行if还是执行else），那么就可以提前把这些指令放到缓存中，CPU执行的时候就会很快了。

如果一个数组的内容完全随机的话，那么分支预测器就很难进行正确的预测。但如果数组内容是有序的，它就会根据历史命中数据的情况对未来进行预测，那命中率就会很高，所以先排序后遍历的速度会比较快。

怎么验证指令缓存命中率的情况呢？

在Linux下，可以使用Perf性能分析工具进行验证。通过-e选项，指定branch-loads和branch-loads-misses事件，可以分别统计出分支预测成功的次数和 分支预测失败的次数 ，通过L1-icache-load-misses事件也能统计一级缓存中指令未命中的次数。但是，这些性能事件都属于硬件事件，perf工具能否统计这些事件取决于CPU是否支持以及芯片原厂是否去实现了该接口，我看很多都是不支持或者没实现的。

另外，在Linux内核中，可以看到大量的likely和unlikely宏，并且它们都出现if语句中，这 两个宏的作用就是为了提高性能 。

这是显示预测概率的宏，如果你觉得CPU的分支预测不准，但if中条件为"真"的概率很高，那么你就可以使用likely()括起来，以此提升性能。

#define likely(x) __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)
if (likely(a == 1)) …

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Linux

Linux

+关注

关注
87

文章
11391

浏览量
211745
指令

指令

+关注

关注
1

文章
614

浏览量
36012
缓存

缓存

+关注

关注
1

文章
244

浏览量
26883
数组

数组

+关注

关注
1

文章
419

浏览量
26185

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Linux中提高指令缓存命中率

提高指令缓存命中率

评论

CPU一级缓存与二级缓存深度分析

AM335x SDK关于cache的命中率，请问有能改善cache命中率的有效方法吗？请问怎么才能控制RAM映射到cache？

缓存命中率低的原因是什么？

缓存的作用和设计模式

架构设计应用级缓存回收策略

一种高能效的结构不对称指令缓存

基于节点中心性度量的缓存机制

基于概率存储的启发式住处中心网络内容缓存方法

Web代理服务器缓存优化

基于节点热度与缓存替换率的ICN协作缓存

Linux文件缓存使用情况和命中率查看的工具详细概述

一种基于内容优先级的缓存替换策略PFC

把进程绑定到某个 CPU 上运行是怎么实现？

一个GPU工作负载的调查

CPU缓存那些事儿