TCP粘包和拆包产生的原因-电子发烧友网

一、TCP粘包现象

what?

TCP是个“流”协议，即没有边界。由于这个特性以及实际的网络情况，在进行数据传输时假设我们连续调用send分别发送两段数据data1和data2，在接收端有以下几种代表性的情况：

先接收到data1，然后接收到data2。
先接收到data1的部分数据，然后接收到data1余下的部分以及data2的全部。
先接收到data1的全部数据和data2的部分数据，然后接收到data2余下的数据。
一次性接收到了data1和data2的全部数据。

其中，1是理想情况，也就是我们需要的。对于2,3,4的情况就是常说的“粘包”，就需要把接收到的数据进行拆包，拆成一个个独立的数据包，而为了拆包就必须在发送端进行封包。

对于UDP来说不存在拆包问题，因为UDP是一个“数据包“协议，也就是两段数据是有界限的，在接收端要么接收不到数据要么就是一段完整的数据，不会少接收也不会多接收。

这里，笔者在发送端连续发送4096个字节的数据，然后在接收端打印接收到的数据字节数，可以很明显的看到出现了粘包现象。

receive num=2648
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------

why?

为什么会出现粘包这种现象呢，以下几点原因。

由Nagle算法造成的发送端粘包。Nagle算法是一种改善网络传输效率的算法，但也可能造成困扰。简单的说，当提交一端数据给TCP时，TCP并不立刻发送此段数据，而是等待一段时间，看看在等待期间是否还有要发送的数据，若有则会一次吧多段数据发送出去。
接收端接收不及时造成的接收端粘包。TCP会把接收到的数据存在自己的缓冲区中，然后通知应用层取数据。当应用层由于某些原因不能及时取出TCP的数据，就会造成TCP缓冲区中存放多段数据。
这种原因是笔者根据实践得出的，不知道对不对。若发送端发送很大的数据包，比如4096字节，由于网卡和路由器中MTU的限制。MTU规定为1500字节，那么每次数据包要低于1500字节（除去IP头部等字节），否则网口以及网络传输途径中路由器等会自动对其进行分包操作。造成接收端并不能一次接收到发送的字节数。

附：

TCP粘包和拆包产生的原因

应用程序写入数据的字节大小大于套接字发送缓冲区的大小
进行MSS大小的TCP分段。MSS是最大报文段长度的缩写。MSS是TCP报文段中的数据字段的最大长度。数据字段加上TCP首部才等于整个的TCP报文段。所以MSS并不是TCP报文段的最大长度，而是：MSS=TCP报文段长度-TCP首部长度
以太网的payload大于MTU进行IP分片。MTU指：一种通信协议的某一层上面所能通过的最大数据包大小。如果IP层有一个数据包要传，而且数据的长度比链路层的MTU大，那么IP层就会进行分片，把数据包分成若干片，让每一片都不超过MTU。注意，IP分片可以发生在原始发送端主机上，也可以发生在中间路由器上。

二、封包和解包

How?

最初解决“粘包”的问题，采用在两次send之间调用sleep休眠小一段时间来解决，缺点是显而易见的：传输效率大大降低，而且也并不可靠。

对数据包进行封包和解包就能解决这个问题：

封包就是给一段数据加上包头，这样一来数据包就分为包头和包体两部分内容了（可加上包尾）。包头其实是一个大小固定的结构体，其中有个结构体成员变量表示包体的长度，这是个很重要的变量，其他的结构体成员可根据需要自己定义。根据固定的包头长度以及包头中含有的包体长度变量值就能正确的拆分出一个完整的数据包。

利用底层的缓冲区来进行拆包时，由于TCP也维护了一个缓冲区，所以可以利用TCP的缓冲区来拆包，也就是循环不停地接收包头给出的数据，直到收够为止，这就是一个完整的TCP包。
三、代码示例

为了解决“粘包”问题，大家通常会在所发送的内容前，加上发送内容的长度，所以对方会先收到4Byte，解析获得接下来所需要接收的长度，再进行收包。

当然这个代码中还有一些待改进的地方：我们并不能保证接收到的4Byte数据正好表示的是数据的实际长度，改进办法是在包头这个结构体变量里添加表示数据头的标志。

发送端：

#include < stdio.h >
#include < stdlib.h >
#include < string.h >
#include < unistd.h >
#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < errno.h >
/*
客户端给服务端发送一个字符串，由于双方都不知道这个字符串有多长，因此发送数据前的前面4个字节表示字符串的大小
数据格式：4字节（存储字符串实际长度） + 字符串内容
*/
/*
该函数能够发送指定长度的数据。一次发送不完，可以接着发送，直到发送完指定长度为止
*/
int MySend( int iSock, char * pchBuf, size_t tLen){
        int iThisSend;
        unsigned int iSended=0;//has send bytes
        if(tLen == 0)
               return(0);
        while(iSended< tLen){
              do{
                     iThisSend = send(iSock, pchBuf, tLen-iSended, 0);//this time  
              } while((iThisSend< 0) && (errno==EINTR));
               if(iThisSend < 0){
                      return(iSended);
              }
              iSended += iThisSend;
              pchBuf += iThisSend;
       }
        return(tLen);
}

#define DEFAULT_PORT 6666

int main( int argc, char * argv[]){
    int connfd = 0;
    int cLen = 0;
    struct sockaddr_in client;
    if(argc < 2){
        printf(" Uasge: clientent [server IP address]n");
        return -1;
    }
    client.sin_family = AF_INET;
    client.sin_port = htons(DEFAULT_PORT);
    client.sin_addr.s_addr = inet_addr(argv[1]);
    connfd = socket(AF_INET, SOCK_STREAM, 0);
    if(connfd < 0){
        printf("socket() failure!n" );
        return -1;
    }

    if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < 0){
        printf("connect() failure!n" );
        return -1;
    }
	//
    ssize_t writeLen;
    char *sendMsg = "0123456789";
    int tLen=strlen(sendMsg);
    printf("tLen:%dn" ,tLen);
    int iLen=0;
    char * pBuff= new char [100];
    *(int*)(pBuff+iLen)= htonl(tLen);
    iLen+=sizeof( int);
    memcpy(pBuff+iLen,sendMsg,tLen);
    iLen+=tLen;
    writeLen= MySend(connfd, pBuff, iLen);
    if (writeLen < 0) {
       printf("write failedn" );
       close(connfd);
       return 0;
    }
    else{
       printf("write sucess, writelen :%d, sendMsg:%sn",writeLen,sendMsg);
    }
    close(connfd);
    return 0;
}

服务器端：

#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < unistd.h >
#include < stdio.h >
#include < stdlib.h >
#include < strings.h >
#include < sys/wait.h >
#include < string.h >
#include < errno.h >

/*
该函数能够接受指定长度(字节)的数据。循环接收，直到接受完指定数量为止。
*/
int MyRecv( int iSock, char * pchBuf, size_t tCount){
        size_t tBytesRead=0;
        int iThisRead;
        while(tBytesRead < tCount){
              do{
                     iThisRead = read(iSock, pchBuf, tCount-tBytesRead);
              } while((iThisRead< 0) && (errno==EINTR));
              if(iThisRead < 0){
                      return(iThisRead);
              }else if (iThisRead == 0)
                      return(tBytesRead);
              tBytesRead += iThisRead;
              pchBuf += iThisRead;
       }
}

#define DEFAULT_PORT 6666
int main( int argc, char ** argv){
    int sockfd,acceptfd; /* 监听socket: sock_fd,数据传输socket: acceptfd */
    struct sockaddr_in my_addr; /* 本机地址信息 */
    struct sockaddr_in their_addr; /* 客户地址信息 */
    unsigned int sin_size, myport=6666, lisnum=10;
    if ((sockfd = socket(AF_INET , SOCK_STREAM, 0)) == -1) {
       perror("socket" );
       return -1;
    }

    printf("socket ok n");
    my_addr.sin_family=AF_INET;
    my_addr.sin_port=htons(DEFAULT_PORT);
    my_addr.sin_addr.s_addr = INADDR_ANY;
    bzero(&(my_addr.sin_zero), 0);

    if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr )) == -1) {
        perror("bind" );
        return -2;
    }

    printf("bind ok n");
    if (listen(sockfd, lisnum) == -1) {
        perror("listen" );
        return -3;
    }
    printf("listen ok n");
    char recvMsg[10];
    sin_size = sizeof(my_addr);
    acceptfd = accept(sockfd,(struct sockaddr *)&my_addr,&sin_size);
    if (acceptfd < 0) {
       close(sockfd);
       printf("accept failedn" );
       return -4;
    }

    ssize_t readLen = MyRecv(acceptfd, recvMsg, sizeof( int));
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }

    int len=( int)ntohl(*( int*)recvMsg);
    printf("len:%dn",len);
    readLen = MyRecv(acceptfd, recvMsg, len);
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }
    recvMsg[len]='�';//接收到的数据并没有结束符'�',因此需要加上结束符'�
    printf("recvMsg:%sn" ,recvMsg);
    close(acceptfd);
    return 0;
  }

Makefile：

all:tcpServer tcpClient
tcpServer:tcpServer.o
	gcc -g -o tcpServer tcpServer.o
tcpClient:tcpClient.o
	gcc -g -o tcpClient tcpClient.o
tcpServer.o:tcpServer.c
	gcc -g -c tcpServer.c
tcpClient.o:tcpClient.c
	gcc -g -c tcpClient.c
clean:all
	rm all

运行截图：

四、总结思考

这篇文章一个非常核心的代码就是readn和writen函数，说白了，就一直读，读到指定的字节数为止。其实，在recv函数中，最后参数如果是MSG_WAITALL, 那么就可以用recv函数一行代码，替代上述所有代码。

大家可以对比下代码：

ssize_t readn(int fd, void *buf, int n)
{
	size_t nleft = n;   // left的意思是“剩下”, 而非“左边”
	char *bufptr = buf;
	ssize_t nread;
	while(nleft > 0)
	{
		if((nread = read(fd, bufptr, n)) < 0)
		{
			if(errno == EINTR) 	// 遇到中断
			{ 
				continue;   // 或者用 nread = 0;
			}
			else
			{
				return -1;  // 真正错误
			}
		}
		else if(nread == 0) // 对端关闭
		{
			break;
		}

		nleft -= nread;
		bufptr += nread;
	}

	return (n - nleft);
}


//一句话代码（MSG_WAITALL），前提套接字是阻塞的
 while ((num = recv(connectfd, recvbuf+buf_pos, recv_size,MSG_WAITALL)) > 0) {
 }

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据传输

数据传输

+关注

关注
9

文章
1981

浏览量
65168
缓冲

缓冲

+关注

关注
0

文章
53

浏览量
17922
TCP

TCP

+关注

关注
8

文章
1392

浏览量
79856
Data

Data

+关注

关注
0

文章
63

浏览量
38472
字符串

字符串

+关注

关注
1

文章
587

浏览量
20765

lwip tcp丢包的原因？

使用lwip协议栈，作为客户端应答2帧数据时，会有粘包问题，在tcp write 后调用tcp output没有效果，设置 #define TF_NODELAY((u8_t)0x40U

发表于 05-10 06:51

tcp_client例程为何去掉发送后，一直接收就会容易出现数据粘包呢？

/ portTICK_PERIOD_MS);} 代码如下，当我使用tcp_client例程，并且把发送数据注释掉，再接收数据就很容易出现TCP数据粘包，求助 [22:43:18.32

发表于 06-17 07:47

未拆包10年的FLASH芯片是否可以使用

公司无意进到了2007年的一批未拆包的FALSH芯片，(nor flash)，部分拆包焊接，发现芯片还可以用，但不知道这类y存放时间过长的FLASH芯片，使用会有哪些影响，请教相关人员

发表于 06-02 22:52

Labview TCP通信数据分包和粘包处理。

Labview的TCP通信的读函数，会发生数据分包和粘包吗？应该怎么处理TCP读数据，官方的例子没有考虑。

发表于 03-22 14:02

Labview TCP通信问题

labview的TCP通信的读函数，会发生数据分包和粘包吗？应该怎么处理TCP读数据，官方的例子没有考虑。

发表于 03-22 14:07

配置能粘便能拆的粘接剂

配置能粘便能拆的粘接剂当遇到需要将某个元器件固定时，通常采用502胶或环氧

发表于 09-09 15:18 •803次阅读

电烙铁不粘锡原因

电烙铁不粘锡原因烙铁或焊台温度过高，烙铁头表面涂布的锡快速燃烧，产生剧烈的氧化使用不正确或是有缺陷的清洁方法使

发表于 02-27 12:09 •5456次阅读

TCP粘包到底是什么

TCP是一种流式连接,对小包会进行封包缓存发送，大包会出现分包发送。接收端就会发现接收到的数据和发送的数据的次数不一致。这个就是粘包现象。

发表于 02-17 17:45 •4176次阅读

tcp数据包接口封装的介绍

TCP报文格式 TCP协议有着自己的数据包格式，这里把TCP的数据包称为报文段（segment），TCP

发表于 03-22 09:39 •3667次阅读

Linux发送HTTP网络包图像 sk_buff数据结构解析

如果你对Linux是如何实现对用户原始的网络包进行协议头封装与解析，为什么会粘包拆包，期间网络包

发表于 05-10 12:14 •2401次阅读

肥料粉料拆包破包上料机械手应用优势

肥料粉料拆包破包上料机械手其速度是人工拆包速度的3-5倍左右，因为可以连续作业，实际的拆包速度可

发表于 09-13 10:48 •284次阅读

自动拆包破包投料一体机特点与应用流程

拆包破包投料一体机

发表于 04-13 11:17 •501次阅读

【推荐】TCP为何粘包？粘包问题如何解决？

我们在涉及TCP协议的应用中，经常会出现粘包的问题。所谓粘包，简单地讲，就是我有两条消息，明明发送端的代码是分两次发送的，但是在接收端却一次

发表于 09-23 10:00 •976次阅读

tcp丢包究竟会带来多大的性能问题

一个项目对接第三方接口数据。对方是TCP接口，发送数据频率很高。平均2毫秒发送三四千个字节。由于TCP协议的粘包拆

发表于 11-08 16:16 •1613次阅读

如何解决tcp通信中的粘包问题

一、粘包问题概述 1、描述背景采用TCP协议进行网络数据传送的软件设计中，普遍存在粘包问题。这主要是由于现代操作系统的网络传输机制所

发表于 11-11 11:40 •2631次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史