如何对NULL指针地址建立合法映射，从而合法访问NULL指针-电子发烧友网

本文将介绍如何对NULL指针地址建立合法映射，从而合法访问NULL指针。本文表达的宗旨：

任何虚拟地址，只要有合法的页表映射，就能访问！

提到C语言编程，我想几乎所有人都遭遇过NULL指针。我们的代码中总是在不断的判断指针是否为NULL：

if (p1 != NULL) {

//...

}

if (p2 == NULL) {

exit(-1);

}

如果我们忘记了这种判断，我们会收获到段错误：

[15445.731305] a.out[3511]: segfault at 0 ip 000000000040071c sp 00007ffedbacbdd0 error 4 in a.out[400000+1000]

诚然，我们都讨厌segfault，但segfault并非由于访问NULL指针引起的，相反，我们要感谢NULL指针，它帮助我们的程序排除了大量的segfault。

在现代操作系统中，程序访问的地址都是虚拟地址，硬件MMU结合操作系统创建的页表会在进程私有虚拟地址和全局物理地址之间做映射，当程序访问一个虚拟地址的时候，该映射会将这次访问转换成到物理地址的访问。

所以，segfault的本质是程序访问的虚拟内存地址无法合理映射到物理地址的一种错误通知。

引发segfault的地址成为非法地址。

现在，随意给出两个虚拟地址：

unsigned char *p1 = 0x7f1233443344;

unsigned char *p2 = 0xaa12bb443344;

谁能说出哪个虚拟地址是合法的，哪个是非法的？谁也说不出，只有试着访问它的时候才知道，引发segfault的地址就是非法的，否则就是合法的。这可能会对程序数据造成严重的伤害。

因此有必要人为规定一个非法地址，这样在程序中就可以做判断了，只要不是人为规定的那个非法地址，那就是合法的。至于说谁来严格保证其合法性，除了需要编程规范和编程习惯之外，操作系统也确实不会为该非法地址映射可以访问的物理页面。有法可依只是安全的必要条件，加上违法必究才是充分且必要的。

数字0是最特殊的，判断一个值是否为0在硬件层面上也很高效，把0作为非法地址具有高度的可辨识性，于是几乎所有的编程语言都用0来表示非法地址：

#define NULL 0

这就是NULL指针的本质。

现在让我们忘掉编程层面的原则，重新审视NULL指针。

NULL指针指示地址0，地址0没有什么特殊的，它就是进程地址空间的一个普通地址，只要为其映射一个可以访问的物理地址，它就是可以访问的。下面我们就来试试。

首先我们写个简单的C程序：

// gcc access0.c -o access0

#include

int main(int argc, char **argv)

{

int i, j;

unsigned char *nilp = NULL;

unsigned char *used = NULL;

used = (unsigned char *)calloc(128, 1);

// 写页面，调物理页面到内存。

strcpy(used, "zhejiang wenzhou pixie shi");

// 以下的打印便于将信息传递到内核模块，这只是为了方便，真正

// 正确的做法应该自己去hack这些信息，然后传递到内核模块。

printf("pid=%d addr=%p ", getpid(), used);

// 等待内核模块创建NULL地址的页表，完成后敲回车。

getchar();

// 打印NULL指针的前64个字节

for (i = 0; i < 4; i++) {

for (j = 0; j < 16; j++) {

printf("0x%0.2x ", *nilp);

nilp++;

}

printf(" ");

}

getchar();

free (used);

return 0;

}

可以看到，从for循环开始，我们的程序访问NULL指针地址后的64字节的数据。我们希望把NULL指针映射到calloc的地址处，然后看看是不是打印出了 “zhejiang wenzhou pixie shi”。

这个很简单，写一个内核模块，把NULL开始的一个page和calloc返回的used开始的一个page映射到同一个物理页面即可。

下面该写内核模块了，为了简化操作，这里采用Guru模式的stap脚本来进行编程：

// mapNULL.stp

#include

pte_t * get_pte(struct task_struct *task, unsigned long address)

{

pgd_t* pgd;

pud_t* pud;

pmd_t* pmd;

pte_t* pte;

struct mm_struct *mm = task->mm;

static int nil = 0;

static pmd_t gpmd = {0};

static pte_t gpte = {0};

pgd = pgd_offset(mm, address);

if(pgd_none(*pgd) || pgd_bad(*pgd)) {

return NULL;

}

pud = pud_offset(pgd, address);

if(pud_none(*pud) || pud_bad(*pud)) {

return NULL;

}

pmd = pmd_offset(pud, address);

if(pmd_none(*pmd) || pmd_bad(*pmd)) {

*pmd = gpmd;

if(pmd_none(*pmd) || pmd_bad(*pmd)) {

return NULL;

}

pte = pte_offset_kernel(pmd, address);

if (nil != 0) {

pte->pte &= 0xfffffffffffff000;

*pte = gpte;

}

if(pte_none(*pte)) {

return NULL;

}

if (nil == 0) {

gpmd = *pmd;

gpte = *pte;

nil = 1;

}

return pte;

}

function mapNULL:long(pid:long, addr:long)

struct task_struct *task;

pte_t* pte;

void (*fun)(void);

fun = (void (*))0xffffffff81066090;

fun();

task = pid_task(find_pid_n***_ARG_pid, &init_pid_ns), PIDTYPE_PID);

if(!(pte = get_pte(task, STAP_ARG_addr))) {

STAP_RETVALUE = -1;

return;

}

fun();

if(get_pte(task, 0) == NULL) {

STAP_RETVALUE = -1;

return;

}

fun();

STAP_RETVALUE = 0;

probe begin

{

mapNULL($1, $2);

exit();

}

下面演示一下效果，先看直接执行access0，不加载内核模块的效果：

[root@localhost mod]# ./access0

pid=4172 addr=0x1c78010

段错误

[root@localhost mod]#

很显然，访问了“非法地址NULL”之后，收获一个segfault。下面，我们结合内核模块再次来运行access0：

[root@localhost mod]# ./access0

pid=4174 addr=0xf38010

另起一个终端，按照打印的pid和addr加载模块：

[root@localhost mod]# stap -g mapNULL.stp 4174 0xf38010

[root@localhost mod]#

access0的终端敲入回车：

[root@localhost mod]# ./access0

pid=4174 addr=0xf38010

0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x91 0x00 0x00 0x00 0x00 0x00 0x00 0x00

0x7a 0x68 0x65 0x6a 0x69 0x61 0x6e 0x67 0x20 0x77 0x65 0x6e 0x7a 0x68 0x6f 0x75

0x20 0x70 0x69 0x78 0x69 0x65 0x20 0x73 0x68 0x69 0x00 0x00 0x00 0x00 0x00 0x00

0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00

[root@localhost mod]#

可以看到，第二行开始的就是“zhejiang Wenzhou pixie shi ”了：

0x7a 0x68 0x65 0x6a 0x69 0x61 0x6e 0x67 0x20 0x77 0x65 0x6e 0x7a 0x68 0x6f 0x75

0x20 0x70 0x69 0x78 0x69 0x65 0x20 0x73 0x68 0x69 ...

那么第一行是什么呢？很显然，used内存是calloc返回的，这种内存是被malloc内存管理结构锁管理的，第一行的16字节就是这种管理机构，如果我们破坏掉它，那么在最后的free处就会出错。我们可以试一试：

// 打印NULL指针的前64个字节

for (i = 0; i < 4; i++) {

for (j = 0; j < 16; j++) {

printf("0x%0.2x ", *nilp);

if (i == 0) 将第一行16字节数据设置成0ff。

*nilp = 0xff;

nilp++;

}

printf(" ");

}

效果就是：

[root@localhost mod]# ./access0

pid=4184 addr=0x90a010

0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x91 0x00 0x00 0x00 0x00 0x00 0x00 0x00

0x7a 0x68 0x65 0x6a 0x69 0x61 0x6e 0x67 0x20 0x77 0x65 0x6e 0x7a 0x68 0x6f 0x75

0x20 0x70 0x69 0x78 0x69 0x65 0x20 0x73 0x68 0x69 0x00 0x00 0x00 0x00 0x00 0x00

0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00

*** Error in `./access0': munmap_chunk(): invalid pointer: 0x000000000090a010 ***

======= Backtrace: =========

/lib64/libc.so.6(+0x7f5d4)[0x7f06b56705d4]

./access0[0x400789]

/lib64/libc.so.6(__libc_start_main+0xf5)[0x7f06b56133d5]

./access0[0x4005c9]

======= Memory map: ========

00400000-00401000 r-xp 00000000 fd:00 38533721

通过重写NULL指针地址的映射页表，我们成功访问了NULL指针，并且读出了数据。

由于MMU的映射粒度是页面，即4096字节(x86_64平台，也可以是别的值，比如2M)，所以严格来讲，“非法地址”并非只有NULL，而是从0到4096的一个页面。

很多系统正是通过将NULL地址开始的一个page映射到一个不可读写不可访问的物理page来达到捕捉非法地址的效果的。

现在，我们把部分task_struct结构体的内存映射到NULL开始的第一个虚拟地址空间页面，通过修改task结构体的comm来修改自己的名字，达到自省的目的。

修改自己名字的方法很多，prct就可以，但是本文通过映射task结构体的方式进行。

先看用户态C代码：

#include

int main(int argc, char **argv)

{

int i;

unsigned char *nilp = NULL;

// 为模块提供信息。

printf("pid=%d addr=%p ", getpid(), used);

getchar();

// 在一个页面范围查找task的comm字段

for (i = 0; i < 4096; i++) {

// +2是为了跳过“./”，此处没有进行复杂的字符串解析

if (!memcmp(nilp, argv[0]+2, strlen(argv[0])-2)) {

printf("OK ");

// 更改comm字段为皮鞋湿

memcpy(nilp, "pixieshi", 8);

break;

}

nilp++;

}

printf(" ");

getchar();

free (used);

}

下面是对应的内核模块：

// mapCOMM.c

// make -C /lib/modules/`uname -r`/build SUBDIRS=`pwd` modules

#include

#define DIRECT_MAP_START 0xffff880000000000

#define PAGE_TABLE_E 0x8000000000000000

static int pid = 16790;

module_param(pid, int, 0644);

static unsigned long addr = 0;

module_param(addr, long, 0644);

static int nil = 0;

static pmd_t gpmd = {0};

static pte_t gpte = {0};

static unsigned long tskp;

void (*fun)(void);

static pte_t* get_pte(struct task_struct *task, unsigned long address)

{

pgd_t* pgd;

pud_t* pud;

pmd_t* pmd;

pte_t* pte;

struct mm_struct *mm = task->mm;

pgd = pgd_offset(mm, address);

if(pgd_none(*pgd) || pgd_bad(*pgd)) {

return NULL;

}

pud = pud_offset(pgd, address);

if(pud_none(*pud) || pud_bad(*pud)) {

return NULL;

}

pmd = pmd_offset(pud, address);

if(pmd_none(*pmd) || pmd_bad(*pmd)) {

*pmd = gpmd;

if(pmd_none(*pmd) || pmd_bad(*pmd)) {

return NULL;

}

pte = pte_offset_kernel(pmd, address);

if (nil != 0) {

pte->pte = tskp;

}

if(pte_none(*pte)) {

return NULL;

}

if (nil == 0) {

pte_t p = *pte;

gpmd = *pmd;

gpte = p;

nil = 1;

}

return pte;

}

static int mapCOMM_init(void)

{

struct task_struct *task;

pte_t* pte;

int tsk_off;

struct page* page;

fun = 0xffffffff81066090;

fun();

task = pid_task(find_pid_ns(pid, &init_pid_ns), PIDTYPE_PID);

tskp = (unsigned long)task;

tskp -= DIRECT_MAP_START;

tsk_off = tskp & 0xfff;

#define COMM_OFF 1872

// 保证可以在一个页面内找到comm字段

if (tsk_off + COMM_OFF > 0xfff) {

tskp += 0x1000;

}

// 页面对齐

tskp &= 0xfffffffffffff000;

tskp += PAGE_TABLE_E;

// 用户态读写权限

tskp |= 0x67;

if(!(pte = get_pte(task, addr)))

return -1;

fun();

if(!(pte = get_pte(task, 0)))

return -1;

fun();

return -1;

}

static void mapCOMM_exit(void)

{

}

module_init(mapCOMM_init);

module_exit(mapCOMM_exit);

MODULE_LICENSE("GPL");

编译后备用。我们先运行我们的skinshoe进程。

[root@localhost mod]# ./skinshoe

pid=4216 addr=0x22d4010

获得输出信息后，另起终端，加载模块，输入skinshoe打印的信息：

[root@localhost mod]# insmod ./mapCOMM.ko pid=4216 addr=0x22d4010

insmod: ERROR: could not insert module ./mapCOMM.ko: Operation not permitted

此时skinshoe进程的运行终端看看进程的名字有没有改变：

[root@localhost mod]# cat /proc/4216/comm

pixieshi

[root@localhost mod]# ps -e|grep 4216

4216 pts/4 00:00:00 pixieshi

OK，已经改成“皮鞋湿”了。

当然了，合法访问NULL指针其实有更加“正规”的做法，即修改内核参数：

[root@localhost stap]# sysctl -a|grep vm.mmap_min_addr

vm.mmap_min_addr = 4096

[root@localhost stap]# sysctl -w vm.mmap_min_addr=0

vm.mmap_min_addr = 0

[root@localhost stap]# sysctl -a|grep vm.mmap_min_addr

vm.mmap_min_addr = 0

[root@localhost stap]#

然后使用mmap系统调用将指针FIXed map到地址0即可。

说一下本文的缘起以及一些例行的形而上的意义。

前天晚上，有位朋友问了我一个问题，为了备忘，我昨天发了一则朋友圈：

昨天有人问我说为什么NULL指针不能访问，我说NULL指针是可以访问的，NULL就是0，0也是一个合法地址，为什么不能访问？之所以一访问NULL就会收获一个段错误纯粹是编程意义上的人为规定，不存在操作系统硬件层面的硬性机制阻止NULL指针被访问。为此，我还专门写了一个demo，修改页表项为NULL地址映射一个物理页面，NULL地址不光可以读写，还能修改进程名字呢。char *p;char *p = NULL;以上二者是不同的，上面那个p指针是“无”，而下面那个p则是“空”，“无”是什么都没有，“空”是实实在在的空，仔细体会这种略带哲学意味的区别。

关于“空”和“无”，在C/C++编程规范上特别要注意：

防止访问空指针：访问指针前要判断NULL。

杜绝野指针：释放指针后要设置NULL。

总之，我们要依靠“空”，避开“无”。

“无”是什么都没有，薛定谔的无，“空”是实实在在的空，空为万物，万物皆空。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

操作系统

操作系统

+关注

关注
37

文章
6835

浏览量
123351
C语言

C语言

+关注

关注
180

文章
7605

浏览量
136948
null

null

+关注

关注
0

文章
19

浏览量
3978

原文标题：Linux C程序真的不能访问NULL指针吗？

文章出处：【微信号：LinuxDev，微信公众号：Linux阅码场】欢迎添加关注！文章转载请注明出处。

善用Optional，告别NPE

作者：京东物流王亚宁 1、NPE是什么？ NPE:NullPointerException（空指针异常）。可以说自Null的诞生以来它就让无数的程序员为之哀嚎，也是无数系统Bug的来源。托尼·霍尔

发表于 12-18 09:46 •489次阅读

C语言指针学习笔记

本文从底层内存分析，彻底让读者明白C语言指针的本质。

发表于 11-05 17:40 •247次阅读

C语言指针运算符详解

在C语言中，当你有一个指向数组中某个元素的指针时，你可以对该指针执行某些算术运算，例如加法或减法。这些运算可以用来遍历数组中的元素，如ptr[i]等价于*(ptr + i)。然而，如果你的操作使得指针指向了数组以外的位置（除了数

发表于 10-30 11:16 •256次阅读

海外爬虫IP的合法边界：合规性探讨与实践

海外爬虫IP的合法边界主要涉及合规性探讨与实践。

发表于 10-12 07:56 •229次阅读

C语言指针详细解析

野指针，野指针就是指针指向的位置是不可知的（随机的、不正确的、没有明确限制的），其值是随机的，指针变量的值是别的变量的地址，意味着

发表于 09-14 10:03

面试常考+1：函数指针与指针函数、数组指针与指针数组

在嵌入式开发领域，函数指针、指针函数、数组指针和指针数组是一些非常重要但又容易混淆的概念。理解它们的特性和应用场景，对于提升嵌入式程序的效率和质量至关重要。一、

发表于 08-10 08:11 •879次阅读

面试常考+1：函数<b class='flag-5'>指针</b>与<b class='flag-5'>指针</b>函数、数组<b class='flag-5'>指针</b>与<b class='flag-5'>指针</b>数组

面试中的高频问题：指针函数与函数指针，你能完美应对吗？

一直觉得C语言较其他语言最伟大的地方就是C语言中的指针，有些人认为指针很简单，而有些人认为指针很难，当然这里的对简单和难并不是等价于对指针的理解程度。为此在这里对C语言中的

发表于 06-22 08:11 •1735次阅读

面试中的高频问题：<b class='flag-5'>指针</b>函数与函数<b class='flag-5'>指针</b>，你能完美应对吗？

提高C代码可读性的编写技巧与策略

指针是 C 语言的灵魂，是 C 比其他语言更灵活，更强大的地方。所以学习 C 语言必须很好的掌握指针。函数指针，即指向函数在内存映射中的首地址

发表于 04-23 18:25 •504次阅读

为什么指针之间不要随意赋值呢？

指针之间也不能随意赋值。

发表于 03-28 17:13 •695次阅读

函数指针与回调函数的应用实例

通常我们说的指针变量是指向一个整型、字符型或数组等变量，而函数指针是指向函数。函数指针可以像一般函数一样，用于调用函数、传递参数。

发表于 03-07 11:13 •406次阅读

C语言的指针用法

C语言编程中善用指针可以简化一些任务的处理，而对于一些任务（比如动态内存分配），必须要有指针才行的。也就是说精通C指针编程是很有必要的，帮助你成为一名优秀的Cer。

发表于 03-05 14:22 •360次阅读

怎么理解指针的指针？

怎么理解指针的指针？其实这个概念并不难，只是把它放到实际应用中，容易造成困扰。

发表于 02-23 16:46 •1209次阅读

TC275有函数返回指针地址明明有地址返回值变成NULL是为什么？

\",pcb);return (pcb);}调用： struct udp_pcb *udp;udp = udp_new();udp 获取到的地址永远是NULL，但是单步或者是打印看pcb分配是成功的，有地址值;

发表于 02-06 08:18

结构体与指针的关系

体指针则是指向结构体类型的指针，用于操作和访问结构体的成员。下面我们将分别详细解释结构体和结构体指针，并提供相应的示例代码。1.结构体：结构体是一种自定义数据类型

发表于 01-11 08:00 •1007次阅读

函数指针和指针函数是不是一个东西？

函数指针的本质是指针，就跟整型指针、字符指针一样，函数指针指向的是一个函数。

发表于 01-03 16:35 •537次阅读