在用户态应用程序处理的任务中,elf 加载运行是一个比较重要的步骤,下面就分析一下在 rt-smart 操作系统中,想要将一个应用程序运行起来要经过哪些步骤。
ELF 格式介绍
ELF 代表 Executable and Linkable Format。它是一种对可执行文件、目标文件和库使用的文件格式。它在 Linux 下成为标准格式已经很长时间,ELF 一个特别的优点在于,同一文件格式可以用于内核支持的几乎所有体系结构上。
RT-SMART 同样也使用 ELF 作为可执行文件的格式,下面简单介绍一下 ELF 文件格式。
ELF 文件布局和结构
下图为 ELF 文件的基本布局:
上图展示了 elf 文件的重要组成部分:
elf 文件头,除了用于标识ELF文件的几个字节之外,ELF头还包含了有关文件类型和大小的有关信息,
及文件加载后程序执行的入口点信息。
程序头表(program header table)向系统提供了可执行文件的数据在进程虚拟地址空间中组织
方式的相关信息。它还表示了文件可能包含的段数目、段的位置和用途。
各个段保存了与文件相关的各种形式的数据。例如,符号表、实际的二进制码、固定值(如字
符串)或程序使用的数值常数。
节头表(section header table)包含了与各段相关的附加信息。
使用 readelf 工具可以读取该类型文件中的各种数据结构。
关键数据结构
想要理解应用程序的加载运行过程,就必须要先了解 ELF 文件中的关键数据结构,知道可以通过 ELF 文件获取那些程序加载所必须的关键信息,例如文件类型、目标体系架构、版本号、程序入口点以及程序运行所需要的数据段存储在什么位置等等信息。这些信息都存放在 ELF 的相关数据结构中,那么现在就先了解一下 ELF 文件的相关数据结构吧。
下面是在 ELF 加载过程上下文数据结构,这个结构中包括了 eheader、pheader 和 sheader 三个 elf 的关键数据结构。
elf 头表
1typedefstruct 2{ 3unsignedchare_ident[EI_NIDENT];/*前四个字节为0x7fELF,其他的字节位置都有特定的语义*/ 4Elf64_Halfe_type;/*用于区分ELF的文件类型,例如可重定位、可执行、动态库、coredump文件*/ 5Elf64_Halfe_machine;/*指定了文件所需的体系结构*/ 6Elf64_Worde_version;/*保存了版本信息,用于区分不同的ELF变体,目前该规范只定义了版本1*/ 7Elf64_Addre_entry;/*程序入口点*/ 8Elf64_Offe_phoff;/*程序头表在二进制文件中的偏移量*/ 9Elf64_Offe_shoff;/*节头表所在的偏移量*/ 10Elf64_Worde_flags;/*特定于处理器的标志*/ 11Elf64_Halfe_ehsize;/*指定了ELF头的长度,单位为字节*/ 12Elf64_Halfe_phentsize;/*指定了程序头表中一项的长度,单位为字节(所有项的长度都相同)*/ 13Elf64_Halfe_phnum;/*指定了程序头表中项的数目*/ 14Elf64_Halfe_shentsize;/*指定节头表中一项的长度,单位为字节(所有项的长度都相同)*/ 15Elf64_Halfe_shnum;/*指定节头表中项的数目*/ 16Elf64_Halfe_shstrndx;/*包含各节名称的字符串表在节头表中的索引位置*/ 17}Elf64_Ehdr;
程序头表
1typedefstruct 2{ 3Elf64_Wordp_type;/*当前项描述的段的种类,例如可装载段、动态链接、程序解释等段类型*/ 4Elf64_Wordp_flags;/*保存了标志信息,定义了该段的访问权限,RWX*/ 5Elf64_Offp_offset;/*给出了所描述段在文件中的偏移量(从二进制文件起始处开始计算,单位为字节)*/ 6Elf64_Addrp_vaddr;/*给出了段的数据映射到虚拟地址空间中的位置(对于可装载段类型)*/ 7Elf64_Addrp_paddr;/*只支持物理寻址,不支持虚拟寻址的系统,将使用p_paddr保存信息*/ 8Elf64_Xwordp_filesz;/*指定了段在二进制文件中的长度*/ 9Elf64_Xwordp_memsz;/*制定了段在虚拟地址空间中的长度(单位为字节),与文件中物理的长度差值可通过阶段数据或者填充0字节来补偿*/ 10Elf64_Xwordp_align;/*指定了段在内存和二进制文件中对其的方式(p_vaddr和p_offset地址必须是模p_align的,也就是p_align的倍数),例如p_align的值为0x1000=4096,这意味着段必须对其到4KB页*/ 11}Elf64_Phdr;
节头表
1typedefstruct 2{ 3Elf64_Wordsh_name;/*指定了节的名称,其值不是字符串本身,而是字符串表的一个索引*/ 4Elf64_Wordsh_type;/*指定了节的类型,例如不可用、保存程序相关信息、符号表、包含字符串表的节、重定位信息、散列表、动态链接信息等类型*/ 5Elf64_Xwordsh_flags;/*节是否可写(SHF_WRITE),是否将为其分配虚拟内存(SHF_ALLOC),节是否包含可执行的机器代码(SHF_EXECINSTR)*/ 6Elf64_Addrsh_addr;/*指定节映射到虚拟地址空间中的位置*/ 7Elf64_Offsh_offset;/*指定了节在文件中的开始位置*/ 8Elf64_Xwordsh_size;/*指定了节的长度,单位为字节*/ 9Elf64_Wordsh_link;/*引用另一个节头表项,可能根据节类型而进行不同的解释*/ 10Elf64_Wordsh_info;/*与上一项联用*/ 11Elf64_Xwordsh_addralign;/*指定了节数据在内存中对齐的方式*/ 12Elf64_Xwordsh_entsize;/*指定了节中各数据项的长度,前提是这些数据项的长度都相同,例如字符串表*/ 13}Elf64_Shdr;
在 rt-smart 实际编码实现的过程中,为了方便数据传递,设计了一个包含上述三种数据类型的结构,利用该数据结构可以使加载过程实现更加简洁易懂,如下所示:
1structelf_load_context 2{ 3intfd;/*应用程序文件fd*/ 4intlen;/*用于临时使用的len*/ 5uint8_t*load_addr;/*用于临时使用的加载地址*/ 6structrt_lwp*lwp;/*进程句柄*/ 7structprocess_aux*aux;/*进程辅助信息句柄*/ 8rt_mmu_info*m_info;/*进程mmu信息*/ 9Elf_Ehdreheader;/*elf头表*/ 10Elf_Phdrpheader;/*程序头表*/ 11Elf_Shdrsheader;/*节头表*/ 12structmap_rangeuser_area[2];/*在用户空间需要映射的地址空间,0用于代码段,1用于数据段*/ 13};
ELF 标准节
ELF 标准定义了若干固定名称的节。这些用于执行大多数目标文件所需的标准任务。所有名称都从点开始,以便与用户定义节或非标准节相区分,最重要的标准节如下所示:
有了以上基础概念,就可以来探索真正的代码实现了。
探索程序加载代码实现
执行一个新的应用程序功能由 lwp_execve 函数来实现,该函数会初始化好一个进程所需要的运行环境,然后在该环境中启动第一个线程,也就是 main 线程。
暂且先不关注进程 PID 申请以及的 mmu 表初始化等准备工作,将注意力集中在 lwp_load 函数上。该函数将执行如下操作:
打开 elf 文件,返回文件 fd
调用 load_elf 函数开始执行应用程序加载
在 load_elf 函数中,将执行如下操作:
检查 elf 头,判断其魔数、架构类型、版本号等是否符合要求
判断是静态加载还是动态加载
检查程序入口地址是否为有效的用户态地址
遍历读取程序头表以及程序复制信息,将其加载到进程的用户空间里
遍历读取节头表,根据节头表中的信息,计算在用户态需要需要分配多大的地址空间用于存放 text 段以及 data 段
根据上一步骤的计算,修改进程的映射表,真正为数据段分配用户态地址空间
遍历节头表,程序运行所需要数据段加载到用户地址空间中
通过上面的操作,ELF 文件中所有关于程序启动运行所需的数据就都准备好了,接下来就可以在此基础上启动第一个线程,也就是 main 线程了。相关的代码细节在这里就不做赘述了,源代码中都添加了详尽的注释,可以自行查看。
总结
用户态进程代码量较大,同时由于复杂度过高也不容易理解,现在代码经过完善,复杂度降低以后,可读性方面有了巨大提升。想要深入了解用户态的相关实现,还需要至少了解另外三个主题:
进程切换过程中底层架构级别的汇编代码
进程资源管理相关内容,例如 pid、tid 的分配,用户态内存空间映射等
SMP 多核调度原理与实现
后续还会继续分享上述内容给大家。
-
操作系统
+关注
关注
37文章
6803浏览量
123285 -
应用程序
+关注
关注
37文章
3266浏览量
57679 -
elf
+关注
关注
0文章
12浏览量
2181
发布评论请先 登录
相关推荐
评论