详解Linux系统中的零拷贝技术-电子发烧友网

1.前言

Linux系统中一切皆文件，仔细想一下Linux系统的很多活动无外乎读操作和写操作，零拷贝就是为了提高读写性能而出现的。

2. 数据拷贝基础过程

在Linux系统内部缓存和内存容量都是有限的，更多的数据都是存储在磁盘中。对于Web服务器来说，经常需要从磁盘中读取数据到内存，然后再通过网卡传输给用户：

上述数据流转只是大框，接下来看看几种模式。

2.1 仅CPU方式

当应用程序需要读取磁盘数据时，调用read()从用户态陷入内核态，read()这个系统调用最终由CPU来完成；
CPU向磁盘发起I/O请求，磁盘收到之后开始准备数据；
磁盘将数据放到磁盘缓冲区之后，向CPU发起I/O中断，报告CPU数据已经Ready了；
CPU收到磁盘控制器的I/O中断之后，开始拷贝数据，完成之后read()返回，再从内核态切换到用户态；

2.2 CPU&DMA方式

CPU的时间宝贵，让它做杂活就是浪费资源。

直接内存访问（Direct Memory Access），是一种硬件设备绕开CPU独立直接访问内存的机制。所以DMA在一定程度上解放了CPU，把之前CPU的杂活让硬件直接自己做了，提高了CPU效率。

目前支持DMA的硬件包括：网卡、声卡、显卡、磁盘控制器等。

有了DMA的参与之后的流程发生了一些变化：

最主要的变化是，CPU不再和磁盘直接交互，而是DMA和磁盘交互并且将数据从磁盘缓冲区拷贝到内核缓冲区，之后的过程类似。

“【敲黑板】无论从仅CPU方式和DMA&CPU方式，都存在多次冗余数据拷贝和内核态&用户态的切换。
”

我们继续思考Web服务器读取本地磁盘文件数据再通过网络传输给用户的详细过程。

3.普通模式数据交互

一次完成的数据交互包括几个部分：系统调用syscall、CPU、DMA、网卡、磁盘等。

系统调用syscall是应用程序和内核交互的桥梁，每次进行调用/返回就会产生两次切换：

调用syscall 从用户态切换到内核态
syscall返回从内核态切换到用户态

来看下完整的数据拷贝过程简图：

读数据过程：

应用程序要读取磁盘数据，调用read()函数从而实现用户态切换内核态，这是第1次状态切换；
DMA控制器将数据从磁盘拷贝到内核缓冲区，这是第1次DMA拷贝；
CPU将数据从内核缓冲区复制到用户缓冲区，这是第1次CPU拷贝；
CPU完成拷贝之后，read()函数返回实现用户态切换用户态，这是第2次状态切换；

写数据过程：

应用程序要向网卡写数据，调用write()函数实现用户态切换内核态，这是第1次切换；
CPU将用户缓冲区数据拷贝到内核缓冲区，这是第1次CPU拷贝；
DMA控制器将数据从内核缓冲区复制到socket缓冲区，这是第1次DMA拷贝；
完成拷贝之后，write()函数返回实现内核态切换用户态，这是第2次切换；

综上所述：

读过程涉及2次空间切换、1次DMA拷贝、1次CPU拷贝；
写过程涉及2次空间切换、1次DMA拷贝、1次CPU拷贝；

可见传统模式下，涉及多次空间切换和数据冗余拷贝，效率并不高，接下来就该零拷贝技术出场了。

【文章福利】需要C/C++ Linux服务器架构师学习资料点击加群1106675687（资料包括C/C++，Linux，golang技术，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK，ffmpeg等）

4. 零拷贝技术

4.1 出现原因

我们可以看到，如果应用程序不对数据做修改，从内核缓冲区到用户缓冲区，再从用户缓冲区到内核缓冲区。两次数据拷贝都需要CPU的参与，并且涉及用户态与内核态的多次切换，加重了CPU负担。

我们需要降低冗余数据拷贝、解放CPU，这也就是零拷贝Zero-Copy技术。

4.2 解决思路

目前来看，零拷贝技术的几个实现手段包括：mmap+write、sendfile、sendfile+DMA收集、splice等。

4.2.1 mmap方式

mmap是Linux提供的一种内存映射文件的机制，它实现了将内核中读缓冲区地址与用户空间缓冲区地址进行映射，从而实现内核缓冲区与用户缓冲区的共享。

这样就减少了一次用户态和内核态的CPU拷贝，但是在内核空间内仍然有一次CPU拷贝。

mmap对大文件传输有一定优势，但是小文件可能出现碎片，并且在多个进程同时操作文件时可能产生引发coredump的signal。

4.2.2 sendfile方式

mmap+write方式有一定改进，但是由系统调用引起的状态切换并没有减少。

sendfile系统调用是在 Linux 内核2.1版本中被引入，它建立了两个文件之间的传输通道。

sendfile方式只使用一个函数就可以完成之前的read+write 和 mmap+write的功能，这样就少了2次状态切换，由于数据不经过用户缓冲区，因此该数据无法被修改。

从图中可以看到，应用程序只需要调用sendfile函数即可完成，只有2次状态切换、1次CPU拷贝、2次DMA拷贝。

但是sendfile在内核缓冲区和socket缓冲区仍然存在一次CPU拷贝，或许这个还可以优化。

4.2.3 sendfile+DMA收集

Linux 2.4 内核对 sendfile 系统调用进行优化，但是需要硬件DMA控制器的配合。

升级后的sendfile将内核空间缓冲区中对应的数据描述信息（文件描述符、地址偏移量等信息）记录到socket缓冲区中。

DMA控制器根据socket缓冲区中的地址和偏移量将数据从内核缓冲区拷贝到网卡中，从而省去了内核空间中仅剩1次CPU拷贝。

这种方式有2次状态切换、0次CPU拷贝、2次DMA拷贝，但是仍然无法对数据进行修改，并且需要硬件层面DMA的支持，并且sendfile只能将文件数据拷贝到socket描述符上，有一定的局限性。

4.2.4 splice方式

splice系统调用是Linux 在 2.6 版本引入的，其不需要硬件支持，并且不再限定于socket上，实现两个普通文件之间的数据零拷贝。

splice 系统调用可以在内核缓冲区和socket缓冲区之间建立管道来传输数据，避免了两者之间的 CPU 拷贝操作。

splice也有一些局限，它的两个文件描述符参数中有一个必须是管道设备。

5.本文小结

本文通过介绍数据交互的基本过程、传统模式的缺点，进而介绍了零拷贝的一些实现方法。

零拷贝技术是非常底层且重要的读写优化，对于服务并发能力的提升有很大帮助。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cpu

cpu

+关注

关注
68

文章
10936

浏览量
213643
Linux

Linux

+关注

关注
87

文章
11364

浏览量
210997

深度解析Linux中零拷贝原理

所谓「零拷贝」描述的是计算机操作系统当中，CPU不执行将数据从一个内存区域，拷贝到另外一个内存区域的任务。通过网络传输文件时，这样通常可以节省 CPU 周期和内存带宽。

发表于 03-01 14:39 •2681次阅读

Linux LED子系统详解

Linux LED子系统详解

发表于 06-10 10:37 •1636次阅读

<b class='flag-5'>Linux</b> LED子<b class='flag-5'>系统</b><b class='flag-5'>详解</b>

嵌入式Linux系统开发技术详解——基于ARM

嵌入式Linux系统开发技术详解——基于ARM，一共6个部分，给大家参考

发表于 06-24 21:19

ARM嵌入式Linux系统开发详解

了Linux技术的*发展，全部采用当前最流行和稳定的Linux发行版或者相关工具，是Linux爱好者学习Linux的好帮手。《

发表于 09-14 08:57

Linux拷贝命令

Linux cp命令拷贝命令非常实用，cp命令可以将指定路径下的文件（目录）拷贝到（成）另一文件或目录中

发表于 07-24 08:32

RAID中零拷贝技术研究

从实际测试和理论分析角度出发,研究了采用零拷贝技术对提高RAID性能的重要性.研究结果表明零拷贝技术

发表于 07-01 17:09 •20次下载

linux核心技术详解

很好的一本Linux技术详解，值得一读。

发表于 11-09 17:35 •5次下载

《Linux设备驱动开发详解》第5章、Linux文件系统与设备文件系统

《Linux设备驱动开发详解》第5章、Linux文件系统与设备文件系统

发表于 10-27 14:13 •0次下载

Linux系统中EXP命令详解质量汇总

Linux系统中EXP命令详解质量汇总

发表于 05-14 09:35 •1次下载

深度解读Linux的3种“拷贝”命令

概述 Linux 下有 3 种“拷贝”，分别是 ln，cp，mv，这 3 个命令貌似都能 copy 出一个新的文件出来。细心的小伙伴看到我给 “拷贝” 打上了双引号？因为 Linux

发表于 05-28 15:35 •3325次阅读

深入理解Linux系统零拷贝技术

内存拷贝是比较耗时操作，零拷贝是常用优化手段，今天分享的文章就是Linux系统零

发表于 09-01 15:12 •3132次阅读

传统IO演化至零拷贝的过程

零拷贝(Zero-Copy)用于在数据读写过程中减少不需要的CPU拷贝，CPU就那么几个，减少它的负担自然可以提高处理效率。数据传输有本地的文件拷贝

发表于 11-09 09:09 •542次阅读

什么是零拷贝技术

的应用中，经常会发生这种问题，导致CPU都在做数据拷贝，没有时间处理其他的应用功能了，直接的感觉就是处理卡顿。零拷贝技术针对这种问题，

发表于 11-27 16:20 •528次阅读

如何进行零拷贝性能测试

TogetherROS™·Bot零拷贝性能测试我们使用TogetherROS™·Bot系统内部集成的性能测试工具——performance_test，来评估下开启零

发表于 11-27 16:51 •522次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

详解Linux系统中的零拷贝技术

1.前言

2. 数据拷贝基础过程

2.1 仅CPU方式

2.2 CPU&DMA方式

3.普通模式数据交互

4. 零拷贝技术

4.1 出现原因

4.2 解决思路

4.2.1 mmap方式

4.2.2 sendfile方式

4.2.3 sendfile+DMA收集

4.2.4 splice方式

5.本文小结

评论

深度解析Linux中零拷贝原理

Linux LED子系统详解

Linux系统命令及其使用详解

嵌入式Linux系统开发技术详解——基于ARM

ARM嵌入式Linux系统开发详解

Linux拷贝命令

RAID中零拷贝技术研究

linux核心技术详解

《Linux设备驱动开发详解》第5章、Linux文件系统与设备文件系统

Linux系统中EXP命令详解质量汇总

深度解读Linux的3种“拷贝”命令

深入理解Linux系统零拷贝技术

传统IO演化至零拷贝的过程

什么是零拷贝技术

如何进行零拷贝性能测试