Cache与性能优化精彩问答38条
占用非常大的面积,大概在一半以上,而且一个好的 Cache 的设计复杂度非常高,可能比较 CPU 的....
从计算机体系结构看操作系统
尽管依然能够制造出更多更小的晶体管,但已不像过去那样了,单个晶体管的功耗已不能很好地按比例缩小。由于....
SoC低功耗问题定位及优化的10个思路
在低功耗特性中,软件可能实现起来并没有那么难,从设计到实现的时间可能并不会耗时特别长,耗时最长的是后....
Linux内核性能剖析的方法学和主要工具
p增大的时候,不仅仅是分子增大,分母也增大,分母σ因子随着p线性增大,k因子随着p的平方线性增大。U....
宋宝华:深入理解cache对写好代码至关重要
现代CPU,通常L1 cache的指令和数据是分离的。这样可以实现2条高速公路并行访问,CPU可以同....
什么是TrustZone?TrustZone是如何实现安全隔离的
CPU 通过内存映射手段给每个进程营造一个单独的地址空间来隔离多个进程的代码和数据,通过内核空间和用....
Linux跟踪系统和BPF的整体认知
可观测性 (observability) 是指通过全面观测来理解一个系统, 可以实现这一目标的工具就....
一文搞懂ARM SoC功耗控制架构
随着芯片的集成化程度提升,很多模块都做到芯片的内部,比如isp、dsp、gpu,这样做成片上系统(S....
了解DRM架构的形成、功能流程实现
传统linux显示设备驱动开发时,通常使用FB驱动架构,随着显卡性能升级:显示覆盖(菜单层级)、GP....
CET为何而生?CET安全防御机制解析
CET(Control-flow Enforcement Technology)机制是 Intel提....
揭开xenomai双核系统下clock机制的面纱
clock可以说是操作系统正常运行的发动机,整个操作系统的活动都受到它的激励。系统利用时钟中断维持系....
KeenOpt调优算法框架实现对调优对象和配套工具的快速适配
今天, KeenTune 再次带来开源重磅特性——新增通用的调优算法框架:keenopt。有了 ke....
智能座舱是智能手机的延续
手机遭遇10年来出货新低 1/ 根据中国信息通信研究院的数据,今年上半年,全球最大市场的智能手机出货....
如何理解这个Seccomp profile呢?
本文从 Seccomp 机制出发,在 linux 内核层面介绍了 Seccomp 可以实现的安全能力....
基于格密码全同态加密的数学基础
傅里叶变换一句话描述:将用一般多项式表示的时域的信号,变成频域的信号(这句不懂没关系,看完后面就懂了....
BPF技术知识和实践经验
随着容器技术的发展,越来越多业务甚至核心业务开始采用这一轻量级虚拟化方案。作为一项依然处于发展阶段的....
一文几下Linux内核透明巨型页支持
处理大内存的性能关键计算应用程序工作集已经运行在libhugetlbfs之上,然后依次运行 huge....
讨论经典的DynamIQ的cache架构
Weakly inclusive: 当miss的时候,数据会被同时缓存到L1和L2,但在之后,L2中....
Hungtask原理及分析
Linux系统在运行过程中,可能发生各种各样的卡死情况。有的表现为某个或某些CPU无法调度其他进程或....
Coolbpf 在perf 事件中的增强
Perf 是内置于 Linux 内核源码树中的性能剖析(profiling)工具。它基于事件采样的原....
如何通过 tracefs 实现跟踪能力
kprobe 为内核中提供的动态跟踪机制,/proc/kallsym 中的函数几乎都可以用于跟踪,但....
深入了解 ELF每个结构的细节
长期以来只知道 ELF 是一种广泛使用的文件格式规范,常指动态库、bin等,一直没动力深入研究。出于....
什么是ELF文件?ELF文件结构概览
ELF 的全称是 Executable and Linking Format,即“可执行可连接格式”....
BPF为内核编程提供了一个新的参考模型
这个新的编程环境混合使用了 C语言扩展以及运行时环境的组合实现的,这个运行时环境包含了 Clang、....
cache的排布与CPU的典型分布
对cache的掌握,对于Linux工程师(其他的非Linux工程师也一样)写出高效能代码,以及优化L....