上一篇文章对Linux sockfs文件系统的注册和挂载进行了分析,本文在上文基础上进一步全面分析socket底层的相关实现。
一、socket与inode
socket在Linux中对应的文件系统叫Sockfs,每创建一个socket,就在sockfs中创建了一个特殊的文件,同时创建了sockfs文件系统中的inode,该inode唯一标识当前socket的通信。
如下图所示,左侧窗口使用nc工具创建一个TCP连接;右侧找到该进程id(3384),通过查看该进程下的描述符,可以看到"3 ->socket:[86851]",socket表示这是一个socket类型的fd,[86851]表示这个一个inode号,能够唯一标识当前的这个socket通信连接,进一步在该inode下查看"grep -i "86851" /proc/net/tcp”可以看到该TCP连接的所有信息(连接状态、IP地址等),只不过是16进制显示。
在分析socket与inode之前,先通过ext4文件系统举例:
在VFS层,即抽象层,所有的文件系统都使用struct inode结构体描述indoe,然而分配inode的方式都不同,如ext4文件系统的分配inode函数是ext4_alloc_inode,如下所示:
从函数中可以看出来,函数其实是调用kmem_cache_alloc分配了 ext4_inode_info结构体(结构体如下所示),然后进行了一系列的初始化,最后返回的却是struct inode结构体(如上面代码的return &ei->vfs_inode)。如下结构体ext4_inode_info(ei)所示,vfs_inode是其struct inode结构体成员。
再看一下:ext4_inode、ext4_inode_info、inode之间的关联,
ext4_inode如下所示,是磁盘上inode的结构
ext4_inode_info是ext4文件系统的inode在内存中管理结构体:
inode是文件系统抽象层:
三者的关系如下图,struct inode是VFS抽象层的表示,ext4_inode_info是ext4文件系统inode在内存中的表示,struct ext4_inode是文件系统inode在磁盘中的表示。
VFS采用C语言的方式实现了struct inode和struct ext4_inode_info继承关系,inode与ext4_inode_info是父类与子类的关系,并且Linux内核实现了inode与ext4_inode_info父子类的互相转换,如下EXT4_I所示:
以上是以ext4为例进行了分析,下面将开始从socket与inode进行分析:
sockfs是虚拟文件系统,所以在磁盘上不存在inode的表示,在内核中有struct socket_alloc来表示内存中sockfs文件系统inode的相关结构体:
struct socket与struct inode的关系如下图,正如ext4文件系统中struct ext4_inode_info与struct inode的关系类似,inode和socket_alloc结构体是父类与子类的关系。
从上面分析ext4文件系统分配inode时,是通过ext4_alloc_inode函数分配了ext4_inode_info结构体,并初始化结构体成员,函数最后返回的是ext4_inode_info中的struct inode成员。sockfs文件系统也类似,sockfs文件系统分配inode时,创建的是socket_alloc结构体,在函数最后返回的是struct inode。
从上篇文章中,分析了sockfs文件系统注册与挂载,初始化了超级块的函数操作集,如下所示alloc_inode是分配inode结构体的回调函数接口。
sockfs文件系统的inode分配函数是sock_alloc_inode,如下所示:
sock_alloc_inode函数分配了socket_alloc结构体,也就意味着分配了struct socket和struct inode,并最终返回了socket_alloc结构体成员inode。
故struct socket这个字段出生的时候其实就和一个struct inode结构体伴生出来的,它们俩共同封装在struct socket_alloc中,由sockfs的sock_alloc_inode函数分配的,函数返回的是struct inode结构体.和ext4文件系统类型类似。sockfs文件系统也实现了struct inode与struct socket的转换:
二、socket的创建与初始化
首先看一下struct socket在内核中的定义:
在内核中还有struct sock结构体,在struct socket中可以看到那么它们的关系是什么?
1、socket面向上层,sock面向下层的具体协议
2、socket是内核抽象出的一个通用结构体,主要是设置了一些跟fs相关的字段,而真正跟网络通信相关的字段结构体是struct sock
3、struct sock是套接字的核心,是对底层具体协议做的一层抽象封装,比如TCP协议,struct sock结构体中的成员sk_prot会赋值为tcp_prot,UDP协议会赋值为udp_prot。
(关于更多struct sock的分析将在以后的文章中分析)
创建socket的系统调用:在用户空间创建了一个socket后,返回值是一个文件描述符。在SYSCALL_DEFINE3(socket, int, family, int, type, int, protocol)最后调用sock_map_fd进行关联,其中返回的就是用户空间获取的文件描述符fd,sock就是调用sock_create创建成功的socket.
socket的创建将调用sock_create函数:
__sock_create函数调用sock_alloc函数分配socket结构和文件节点:
socket结构体的创建在sock_alloc()函数中:
new_inode_pseudo中通过继续调用sockfs文件系统中的sock_alloc_inode函数完成struct socket_alloc的创建并返回其结构体成员struct inode。
然后调用SOCKT_I函数返回对应的struct socket。
在_sock_create中:pf->create(net, sock, protocol, kern);
通过相应的协议族,进一步调用不同的socket创建函数。pf是struct net_proto_family结构体,如下所示:
net_families[]数组里存放的是各个协议族的信息,以family字段作为下标,对应的值为net_pro_family结构体。此处我们针对TCP协议分析,因此我们family字段是AF_INET,pf->create将调用inet_create函数继续完成底层struct sock等创建和初始化。
inet_create函数完成struct socket、struct inode、struct sock的创建与初始化后,调用sock_map_fd(sock, flags & (O_CLOEXEC | O_NONBLOCK));完成socket与文件系统的关联,负责分配文件,并与socket进行绑定:
1、调用sock_alloc_file,分配一个struct file,并将私有数据指针指向socket结构
2、fd_install 对应文件描述符和file
get_unused_fd_flags(flags)继续调用alloc_fd完成文件描述符的分配。
sock_alloc_file(sock, flags, NULL)分配一个struct file结构体
其中file = alloc_file(&path, FMODE_READ | FMODE_WRITE,
&socket_file_ops);分配了file结构体并进行初始化:
其中file->f_op = fop,将socket_file_ops传递给文件操作表
以上操作完成了struct socket、struct sock、struct file等的创建、初始化、关联,并最终返回socket描述符fd
socket描述符fd和我们平时操作文件的文件描述符相同,那么会有一个疑问,可以看到struct file_operations socket_file_ops函数表中并没有提供write()和read()接口,只是看到read_iter,write_iter等接口,那么系统是如何处理的呢?
以write()为例:
sys_write()->__vfs_write()
从__vfs_write函数中可以看出来,如果socket函数表中没有提供write接口函数,则调用new_sync_write:
call_write_iter:
从以上__vfs_write()分析,如果文件函数表结构提供了write接口函数则调用write函数,如果文件函数表结构没有提供write接口函数(如socket操作函数表中没有提供write接口),则调用write_iter接口,即调用socket操作函数表中的sock_write_iter。就这样通过socket fd进行普通文件系统那样通过描述符进行读写等。
用户得到socket fd,可以进行地址绑定、发送以及接收数据等操作,在Linux内核中有相关的函数完成从socket fd到struct socket、struct file的转换:
fdget()函数从当前进程的files_struct结构中找到网络文件系统中的file文件指针,并封装在struct fd结构体中。sock_from函数通过得到的file结构体得到对应的socket结构指针。sock_from函数如下:
至此,socket底层来龙去脉的大体结构大概就分析到这,最为核心的struct sock相关的联系以及底层协议的初始化等将在以后的文章进行分析。
评论
查看更多