0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鸿蒙内核源码分析:关于内存涉及的C7,C2,C13三个寄存器

鸿蒙系统HarmonyOS 来源:oschina. 作者:深入研究鸿蒙 2020-10-29 10:41 次阅读

ARM-CP15协处理器

ARM处理器使用协处理器15(CP15)的寄存器来控制cache、TCM和存储器管理。CP15的寄存器只能被MRC和MCR(Move to Coprocessor from ARM Register )指令访问,包含16个32位的寄存器,其编号为0~15。本篇重点讲解其中的 C7,C2,C13三个寄存器。

拆解一段汇编代码

上来看段汇编,读懂内核源码不会点汇编是不行的 , 但不用发怵,没那么恐怖,由浅入深, 内核其实挺好玩的。见于 arm.h,里面全是这些玩意。

#define DSB __asm__ volatile("dsb" ::: "memory")
#define ISB __asm__ volatile("isb" ::: "memory")
#define DMB __asm__ volatile("dmb" ::: "memory")

STATIC INLINE VOID OsArmWriteBpiallis(UINT32 val)
{
    __asm__ volatile("mcr p15, 0, %0, c7,c1,6" ::"r"(val));
    __asm__ volatile("isb" ::: "memory");
}
指 令 说 明 语法格式
mcr 将ARM处理器的寄存器中的数据写到CP15中的寄存器中 mcr{} p15, , , , , {
mrc 将CP15中的寄存器中的数据读到ARM处理器的寄存器中 mcr{} p15, , , , , {

cond:为指令执行的条件码。当cond忽略时指令为无条件执行。
Opcode_1:协处理器的特定操作码. 对于CP15寄存器来说,opcode1=0
Rd:作为源寄存器的ARM寄存器,其值将被传送到协处理器寄存器中,或者将协处理器寄存器的值传送到该寄存器里面 ,通常为R0
CRn:作为目标寄存器的协处理器寄存器,其编号是C~C15。
CRm:协处理器中附加的目标寄存器或源操作数寄存器。如果不需要设置附加信息,将CRm设置为c0,否则结果未知
Opcode_2:可选的协处理器特定操作码。(用来区分同一个编号的不同物理寄存器,当不需要提供附加信息时,指定为0

这句汇编的指令字面意思是: 将ARM寄存器R0的数据写到CP15中编号为7的寄存器中,值由外面传进来。

例如 OsArmWriteBpiallis(0)做了4个动作

1.把0值写入R0寄存器,注意这个寄存器是ARM即CPU的寄存器,::"r"(val)意思代表向GCC编译器声明,会修改R0寄存器的值,改之前提前打好招呼,都是绅士文明人。其实编译器的功能是非常强大的,不仅仅是大家普遍认为的只是编译代码的工具而已。

2.volatile的意思还是告诉编译器,不要去优化这段代码,原封不动的生成目标指令。

3."isb" ::: "memory" 还是告诉编译器内存的内容可能被更改了,需要无效所有Cache,并访问实际的内容,而不是Cache!

4.再把R0的值写入到C7中,C7是CP15协处理器的寄存器。C7寄存器是负责什么的?对照下面的表。

CP15有哪些寄存器

寄存器编号 基本作用 在MMU中的作用 在PU中的作用
0 ID编码(只读) ID编码和cache类型
1 控制位(可读写) 各种控制位
2 存储保护和控制 地址转换表基地址 Cachability的控制位
3 存储保护和控制 域访问控制位 Bufferablity控制位
4 存储保护和控制 保留 保留
5 存储保护和控制 内存失效状态 访问权限控制位
6 存储保护和控制 内存失效地址 保护区域控制
7 高速缓存和写缓存 高速缓存和写缓存控制
8 存储保护和控制 TLB控制 保留
9 高速缓存和写缓存 高速缓存锁定
10 存储保护和控制 TLB锁定 保留
11 保留
12 保留
13 进程标识符 进程标识符
14 保留
15 因不同设计而异 因不同设计而异 因不同设计而异

这句话真正的意思是:关闭高速缓存和写缓存控制!,其他部分寄存器下面会讲,先有个大概印象。

mmu从哪里获取 page table 的信息?答案是: TTB

TTB寄存器(Translation table base)

参考上表可知TTB寄存器是CP15协处理器的C2寄存器,存页表的基地址,即一级映射描述符表的基地址。围绕着TTB鸿蒙提供了以下读取函数。简单说就是内核从外面不断的修改和读取寄存器值,而MMU只会直接通过硬件读取这个寄存器的值,以达到MMU获取不一样的页表进行进程虚拟地址和物理地址的转换。还记得吗?每个进程的页表都是独立的!

那么什么情况下会修改里面的值呢?换页表意味着mmu在进行上下文的切换!还是直接看代码吧。

mmu上下文

只被这一个函数调用。毫无疑问LOS_ArchMmuContextSwitch是关键函数。

typedef struct ArchMmu {
    LosMux              mtx;            /**< arch mmu page table entry modification mutex lock */
    VADDR_T             *virtTtb;       /**< translation table base virtual addr */
    PADDR_T             physTtb;        /**< translation table base phys addr */
    UINT32              asid;           /**< TLB asid */
    LOS_DL_LIST         ptList;         /**< page table vm page list */
} LosArchMmu;

// mmu 上下文切换
VOID LOS_ArchMmuContextSwitch(LosArchMmu *archMmu)
{
    UINT32 ttbr;
    UINT32 ttbcr = OsArmReadTtbcr();//读取TTB寄存器的状态值
    if (archMmu) {
        ttbr = MMU_TTBRx_FLAGS | (archMmu->physTtb);//进程TTB物理地址值
        /* enable TTBR0 */
        ttbcr &= ~MMU_DESCRIPTOR_TTBCR_PD0;//使能TTBR0
    } else {
        ttbr = 0;
        /* disable TTBR0 */
        ttbcr |= MMU_DESCRIPTOR_TTBCR_PD0;
    }

    /* from armv7a arm B3.10.4, we should do synchronization changes of ASID and TTBR. */
    OsArmWriteContextidr(LOS_GetKVmSpace()->archMmu.asid);//这里先把asid切到内核空间的ID
    ISB;
    OsArmWriteTtbr0(ttbr);//通过r0寄存器将进程页面基址写入TTB
    ISB;
    OsArmWriteTtbcr(ttbcr);//写入TTB状态位
    ISB;
    if (archMmu) {
        OsArmWriteContextidr(archMmu->asid);//通过R0寄存器写入进程标识符至C13寄存器
        ISB;
    }
}
// c13 asid(Adress Space ID)进程标识符
STATIC INLINE VOID OsArmWriteContextidr(UINT32 val)
{
    __asm__ volatile("mcr p15, 0, %0, c13,c0,1" ::"r"(val));
    __asm__ volatile("isb" ::: "memory");
}

再看下那些地方会调用LOS_ArchMmuContextSwitch,下图一目了然。

有四个地方会切换mmu上下文

第一:通过调度算法,被选中的进程的空间改变了,自然映射页表就跟着变了,需要切换mmu上下文,还是直接看代码。代码不是很多,就都贴出来了,都加了注释,不记得调度算法的可去系列篇中看鸿蒙内核源码分析(调度机制篇),里面有详细的阐述。

//调度算法-进程切换
STATIC VOID OsSchedSwitchProcess(LosProcessCB *runProcess, LosProcessCB *newProcess)
{
    if (runProcess == newProcess) {
        return;
    }

#if (LOSCFG_KERNEL_SMP == YES)
    runProcess->processStatus = OS_PROCESS_RUNTASK_COUNT_DEC(runProcess->processStatus);
    newProcess->processStatus = OS_PROCESS_RUNTASK_COUNT_ADD(newProcess->processStatus);

    LOS_ASSERT(!(OS_PROCESS_GET_RUNTASK_COUNT(newProcess->processStatus) > LOSCFG_KERNEL_CORE_NUM));
    if (OS_PROCESS_GET_RUNTASK_COUNT(runProcess->processStatus) == 0) {//获取当前进程的任务数量
#endif
        runProcess->processStatus &= ~OS_PROCESS_STATUS_RUNNING;
        if ((runProcess->threadNumber > 1) && !(runProcess->processStatus & OS_PROCESS_STATUS_READY)) {
            runProcess->processStatus |= OS_PROCESS_STATUS_PEND;
        }
#if (LOSCFG_KERNEL_SMP == YES)
    }
#endif
    LOS_ASSERT(!(newProcess->processStatus & OS_PROCESS_STATUS_PEND));//断言进程不是阻塞状态
    newProcess->processStatus |= OS_PROCESS_STATUS_RUNNING;//设置进程状态为运行状态

    if (OsProcessIsUserMode(newProcess)) {//用户模式下切换进程mmu上下文
        LOS_ArchMmuContextSwitch(&newProcess->vmSpace->archMmu);//新进程->虚拟空间中的->Mmu部分入参
    }

#ifdef LOSCFG_KERNEL_CPUP
    OsProcessCycleEndStart(newProcess->processID, OS_PROCESS_GET_RUNTASK_COUNT(runProcess->processStatus) + 1);
#endif /* LOSCFG_KERNEL_CPUP */

    OsCurrProcessSet(newProcess);//将进程置为 g_runProcess

    if ((newProcess->timeSlice == 0) && (newProcess->policy == LOS_SCHED_RR)) {//为用完时间片或初始进程分配时间片
        newProcess->timeSlice = OS_PROCESS_SCHED_RR_INTERVAL;//重新分配时间片,默认 20ms
    }
}

这里再啰嗦一句,系列篇中已经说了两个上下文切换了,一个是这里的因进程切换引起的mmu上下文切换,还一个是因task切换引起的CPU的上下文切换,还能想起来吗?

第二:是加载ELF文件的时候会切换mmu,一个崭新的进程诞生了,具体将在 鸿蒙内核源码分析(启动加载篇) 会细讲,敬请关注系列篇动态。

其余是虚拟空间回收和刷新空间的时候,这个就自己看代码去吧。

mmu是如何快速的通过虚拟地址找到物理地址的呢?答案是:TLB,注意上面还有个TTB,一个是寄存器, 一个是cache,别搞混了。

TLB(translation lookaside buffer)

TLB是硬件上的一个cache,因为页表一般都很大,并且存放在内存中,所以处理器引入MMU后,读取指令、数据需要访问两次内存:首先通过查询页表得到物理地址,然后访问该物理地址读取指令、数据。为了减少因为MMU导致的处理器性能下降,引入了TLB,可翻译为“地址转换后援缓冲器”,也可简称为“快表”。简单地说,TLB就是页表的Cache,其中存储了当前最可能被访问到的页表项,其内容是部分页表项的一个副本。只有在TLB无法完成地址翻译任务时,才会到内存中查询页表,这样就减少了页表查询导致的处理器性能下降。详细看

照着图说吧,步骤是这样的。

1.图中的page table的基地址就是上面TTB寄存器值,整个page table非常大,有多大接下来会讲,所以只能存在内存里,TTB中只是存一个开始位置而已。

2. 虚拟地址是程序的地址逻辑地址,也就是喂给CPU的地址,必须经过MMU的转换后变成物理内存才能取到真正的指令和数据。

3.TLB是page table的迷你版,MMU先从TLB里找物理页,找不到了再从page table中找,从page table中找到后会放入TLB中,注意这一步非常非常的关键。因为page table是属于进程的会有很多个,而TLB只有一个,不放入就会出现多个进程的page table都映射到了同一个物理页框而不自知。一个物理页同时只能被一个page table所映射。但除了TLB的唯一性外,要做到不错乱还需要了一个东西,就是进程在映射层面的唯一标识符 -asid。

asid寄存器

asid(Adress Space ID) 进程标识符,属于CP15协处理器的C13号寄存器,ASID可用来唯一标识进程,并为进程提供地址空间保护。当TLB试图解析虚拟页号时,它确保当前运行进程的ASID与虚拟页相关的ASID相匹配。如果不匹配,那么就作为TLB失效。除了提供地址空间保护外,ASID允许TLB同时包含多个进程的条目。如果TLB不支持独立的ASID,每次选择一个页表时(例如,上下文切换时),TLB就必须被冲刷(flushed)或删除,以确保下一个进程不会使用错误的地址转换。

TLB页表中有一个bit来指明当前的entry是global(nG=0,所有process都可以访问)还是non-global(nG=1,only本process允许访问)。如果是global类型,则TLB中不会tag ASID;如果是non-global类型,则TLB会tag上ASID,且MMU在TLB中查询时需要判断这个ASID和当前进程的ASID是否一致,只有一致才证明这条entry当前process有权限访问。

看到了吗?如果每次mmu上下文切换时,把TLB全部刷新已保证TLB中全是新进程的映射表,固然是可以,但效率太低了!!!进程的切换其实是秒级亚秒级的,地址的虚实转换是何等的频繁啊,怎么会这么现实呢,真实的情况是TLB中有很多很多其他进程占用的物理内存的记录还在,当然他们对物理内存的使用权也还在。所以当应用程序 new了10M内存以为是属于自己的时候,其实在内核层面根本就不属于你,还是别人在用,只有你用了1M的那一瞬间真正1M物理内存才属于你,而且当你的进程被其他进程切换后,很大可能你用的那1M也已经不在物理内存中了,已经被置换到硬盘上了。明白了吗?只关注应用开发的同学当然可以说这关我鸟事,给我的感觉有就行了,但想熟悉内核的同学就必须要明白,这是每分每秒都在发生的事情。

最后一个函数留给大家,asid是如何分配的?

/* allocate and free asid */
status_t OsAllocAsid(UINT32 *asid)
{
    UINT32 flags;
    LOS_SpinLockSave(&g_cpuAsidLock, &flags);
    UINT32 firstZeroBit = LOS_BitmapFfz(g_asidPool, 1UL << MMU_ARM_ASID_BITS);
    if (firstZeroBit >= 0 && firstZeroBit < (1UL << MMU_ARM_ASID_BITS)) {
        LOS_BitmapSetNBits(g_asidPool, firstZeroBit, 1);
        *asid = firstZeroBit;
        LOS_SpinUnlockRestore(&g_cpuAsidLock, flags);
        return LOS_OK;
    }

    LOS_SpinUnlockRestore(&g_cpuAsidLock, flags);
    return firstZeroBit;
}

编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9027

    浏览量

    366448
  • 寄存器
    +关注

    关注

    31

    文章

    5292

    浏览量

    119802
  • 存储器
    +关注

    关注

    38

    文章

    7428

    浏览量

    163507
  • 协处理器
    +关注

    关注

    0

    文章

    74

    浏览量

    18143
  • 鸿蒙系统
    +关注

    关注

    183

    文章

    2634

    浏览量

    66145
收藏 人收藏

    评论

    相关推荐

    嵌入式学习-飞凌嵌入式ElfBoard ELF 1板卡-i2c与从设备通讯编程示例之i2c设备通信编程

    struct_i2c_param,包含了一些与i2c通信相关的参数,包括设备地址、寄存器地址、数据长度和数据缓冲区。main.cmain.c主要分为
    发表于 11-02 17:01

    飞凌嵌入式ElfBoard ELF 1板卡-i2c与从设备通讯编程示例之i2c设备通信编程

    函数执行i2c写操作。最后,释放动态分配的内存,并返回执行结果。 ()第部分定义了函数func_read_regs,用于从设备读取寄存器
    发表于 11-01 11:28

    飞凌嵌入式ElfBoard ELF 1板卡-i2c与从设备通讯编程示例之i2c-tools工具使用

    注意:学习资料可在ElfBoard官方网站“资料”专区获取。介绍i2c-tools是一专门调试i2c接口的开源工具,可以获取挂载的设备及设备地址,具有在对应的设备上读取和设置寄存器
    发表于 10-29 16:27

    TLC6C598-Q1、TLC6C5912-Q1移位寄存器LED驱动应用

    电子发烧友网站提供《TLC6C598-Q1、TLC6C5912-Q1移位寄存器LED驱动应用.pdf》资料免费下载
    发表于 10-08 10:38 0次下载
    TLC6<b class='flag-5'>C</b>598-Q1、TLC6<b class='flag-5'>C</b>5912-Q1移位<b class='flag-5'>寄存器</b>LED驱动<b class='flag-5'>器</b>应用

    TPIC6C596电源+逻辑移位寄存器应用

    电子发烧友网站提供《TPIC6C596电源+逻辑移位寄存器应用.pdf》资料免费下载
    发表于 09-30 11:00 0次下载
    TPIC6<b class='flag-5'>C</b>596电源+逻辑移位<b class='flag-5'>寄存器</b>应用

    寄存器内存的区别

    在计算机体系结构中,寄存器内存是两至关重要的组成部分。它们各自承担着不同的角色,共同确保计算机系统的正常运行。本文将对寄存器内存进行详
    的头像 发表于 05-12 17:11 1792次阅读

    干货满满:ARM的内核寄存器讲解

    内核寄存器与外设寄存器内核寄存器与外设寄存器是完全不同的概念。
    发表于 04-17 11:47 2723次阅读
    干货满满:ARM的<b class='flag-5'>内核</b><b class='flag-5'>寄存器</b>讲解

    鸿蒙内核源码分析:MMU 协处理

    ® Cortex™-A Series Version: 4.0 Programmer’s Guide》。 在这些 C15 寄存器中和 MMU 关系较大的有 C2C7
    的头像 发表于 02-20 14:28 501次阅读
    <b class='flag-5'>鸿蒙</b>轻<b class='flag-5'>内核</b><b class='flag-5'>源码</b><b class='flag-5'>分析</b>:MMU 协处理<b class='flag-5'>器</b>

    鸿蒙内核源码分析:Newlib C

    功能,通过加上 - nostdinc 与 - nostdlib 强制使用我们自己改造后的 musl-C。 社区及方厂商开发多使用公版工具链 arm-none-eabi-gcc 加上私有定制优化进行编译,LiteOS-M 内核
    的头像 发表于 02-18 15:41 605次阅读
    <b class='flag-5'>鸿蒙</b>轻<b class='flag-5'>内核</b><b class='flag-5'>源码</b><b class='flag-5'>分析</b>:Newlib <b class='flag-5'>C</b>

    arm三个寄存器在gdb调试时的作用

    arm三个寄存器在gdb调试时作用  ARM是一种广泛使用的微处理架构,它广泛应用于移动设备、嵌入式系统和其他高性能计算设备。当我们在使用gdb(GNU调试)调试ARM程序时,了解
    的头像 发表于 01-31 10:44 857次阅读

    s3c2410中断控制模块的中断源状态寄存器是?

    S3C2410是一款由星电子公司设计的具有多种功能的嵌入式处理。其中的中断控制模块用于管理系统的中断请求和中断服务程序。在S3C2410中,中断源状态
    的头像 发表于 01-05 17:28 628次阅读

    MAX17853采样电压大于1400mv的时候,C13C14的电压采样不到怎么解决?

    当MAX17853的14节电压采样接满的时候,单节采样电压大于1400mv的时候,C13C14的电压采样不到,随着采样电压的增加,最多可出现C11-C14四节电池电压采样不到,请问这种出现这种情况的原因是什么?怎么解决? 附件
    发表于 01-03 11:10

    200经典C程序【源码

    电子发烧友网站提供《200经典C程序【源码】.zip》资料免费下载
    发表于 11-21 10:34 2次下载
    200<b class='flag-5'>个</b>经典<b class='flag-5'>C</b>程序【<b class='flag-5'>源码</b>】

    178C语言算法源码下载

    电子发烧友网站提供《178C语言算法源码下载.zip》资料免费下载
    发表于 11-21 09:35 3次下载
    178<b class='flag-5'>个</b><b class='flag-5'>C</b>语言算法<b class='flag-5'>源码</b>下载

    CRC校验码的多种Verilog实现方式

    该CRC-8的生成多项式为G(D)=D8+D2+D+1,对CRC进行简化表示时可以忽略最高位的D8,结合图示中三个异或运算的位置更容易理解生成多项式,8位CRC有8寄存器
    的头像 发表于 11-12 09:53 5080次阅读
    CRC校验码的多种Verilog实现方式