0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TCP粘包和拆包产生的原因

科技绿洲 来源:Linux开发架构之路 作者:Linux开发架构之路 2023-11-10 14:07 次阅读

一、TCP粘包现象

what?

TCP是个“流”协议,即没有边界。由于这个特性以及实际的网络情况,在进行数据传输时假设我们连续调用send分别发送两段数据data1和data2,在接收端有以下几种代表性的情况:

  1. 先接收到data1,然后接收到data2。
  2. 先接收到data1的部分数据,然后接收到data1余下的部分以及data2的全部。
  3. 先接收到data1的全部数据和data2的部分数据,然后接收到data2余下的数据。
  4. 一次性接收到了data1和data2的全部数据。

其中,1是理想情况,也就是我们需要的。对于2,3,4的情况就是常说的“粘包”,就需要把接收到的数据进行拆包,拆成一个个独立的数据包,而为了拆包就必须在发送端进行封包。

对于UDP来说不存在拆包问题,因为UDP是一个“数据包“协议,也就是两段数据是有界限的,在接收端要么接收不到数据要么就是一段完整的数据,不会少接收也不会多接收。

这里,笔者在发送端连续发送4096个字节的数据,然后在接收端打印接收到的数据字节数,可以很明显的看到出现了粘包现象。

receive num=2648
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------

why?

为什么会出现粘包这种现象呢,以下几点原因。

  1. 由Nagle算法造成的发送端粘包。Nagle算法是一种改善网络传输效率的算法,但也可能造成困扰。简单的说,当提交一端数据给TCP时,TCP并不立刻发送此段数据,而是等待一段时间,看看在等待期间是否还有要发送的数据,若有则会一次吧多段数据发送出去。
  2. 接收端接收不及时造成的接收端粘包。TCP会把接收到的数据存在自己的缓冲区中,然后通知应用层取数据。当应用层由于某些原因不能及时取出TCP的数据,就会造成TCP缓冲区中存放多段数据。
  3. 这种原因是笔者根据实践得出的,不知道对不对。若发送端发送很大的数据包,比如4096字节,由于网卡和路由器中MTU的限制。MTU规定为1500字节,那么每次数据包要低于1500字节(除去IP头部等字节),否则网口以及网络传输途径中路由器等会自动对其进行分包操作。造成接收端并不能一次接收到发送的字节数。

附:

TCP粘包和拆包产生的原因

  1. 应用程序写入数据的字节大小大于套接字发送缓冲区的大小
  2. 进行MSS大小的TCP分段。MSS是最大报文段长度的缩写。MSS是TCP报文段中的数据字段的最大长度。数据字段加上TCP首部才等于整个的TCP报文段。所以MSS并不是TCP报文段的最大长度,而是:MSS=TCP报文段长度-TCP首部长度
  3. 以太网的payload大于MTU进行IP分片。MTU指:一种通信协议的某一层上面所能通过的最大数据包大小。如果IP层有一个数据包要传,而且数据的长度比链路层的MTU大,那么IP层就会进行分片,把数据包分成若干片,让每一片都不超过MTU。注意,IP分片可以发生在原始发送端主机上,也可以发生在中间路由器上。

二、封包和解包

How?

最初解决“粘包”的问题,采用在两次send之间调用sleep休眠小一段时间来解决,缺点是显而易见的:传输效率大大降低,而且也并不可靠。

对数据包进行封包和解包就能解决这个问题:

封包就是给一段数据加上包头,这样一来数据包就分为包头和包体两部分内容了(可加上包尾)。包头其实是一个大小固定的结构体,其中有个结构体成员变量表示包体的长度,这是个很重要的变量,其他的结构体成员可根据需要自己定义。根据固定的包头长度以及包头中含有的包体长度变量值就能正确的拆分出一个完整的数据包。

利用底层的缓冲区来进行拆包时,由于TCP也维护了一个缓冲区,所以可以利用TCP的缓冲区来拆包,也就是循环不停地接收包头给出的数据,直到收够为止,这就是一个完整的TCP包。
三、代码示例

为了解决“粘包”问题,大家通常会在所发送的内容前,加上发送内容的长度,所以对方会先收到4Byte,解析获得接下来所需要接收的长度,再进行收包。

当然这个代码中还有一些待改进的地方:我们并不能保证接收到的4Byte数据正好表示的是数据的实际长度,改进办法是在包头这个结构体变量里添加表示数据头的标志。

发送端:

#include < stdio.h >
#include < stdlib.h >
#include < string.h >
#include < unistd.h >
#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < errno.h >
/*
客户端给服务端发送一个字符串,由于双方都不知道这个字符串有多长,因此发送数据前的前面4个字节表示字符串的大小
数据格式:4字节(存储字符串实际长度) + 字符串内容
*/
/*
该函数能够发送指定长度的数据。一次发送不完,可以接着发送,直到发送完指定长度为止
*/
int MySend( int iSock, char * pchBuf, size_t tLen){
        int iThisSend;
        unsigned int iSended=0;//has send bytes
        if(tLen == 0)
               return(0);
        while(iSended< tLen){
              do{
                     iThisSend = send(iSock, pchBuf, tLen-iSended, 0);//this time  
              } while((iThisSend< 0) && (errno==EINTR));
               if(iThisSend < 0){
                      return(iSended);
              }
              iSended += iThisSend;
              pchBuf += iThisSend;
       }
        return(tLen);
}

#define DEFAULT_PORT 6666

int main( int argc, char * argv[]){
    int connfd = 0;
    int cLen = 0;
    struct sockaddr_in client;
    if(argc < 2){
        printf(" Uasge: clientent [server IP address]n");
        return -1;
    }
    client.sin_family = AF_INET;
    client.sin_port = htons(DEFAULT_PORT);
    client.sin_addr.s_addr = inet_addr(argv[1]);
    connfd = socket(AF_INET, SOCK_STREAM, 0);
    if(connfd < 0){
        printf("socket() failure!n" );
        return -1;
    }

    if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < 0){
        printf("connect() failure!n" );
        return -1;
    }
	//
    ssize_t writeLen;
    char *sendMsg = "0123456789";
    int tLen=strlen(sendMsg);
    printf("tLen:%dn" ,tLen);
    int iLen=0;
    char * pBuff= new char [100];
    *(int*)(pBuff+iLen)= htonl(tLen);
    iLen+=sizeof( int);
    memcpy(pBuff+iLen,sendMsg,tLen);
    iLen+=tLen;
    writeLen= MySend(connfd, pBuff, iLen);
    if (writeLen < 0) {
       printf("write failedn" );
       close(connfd);
       return 0;
    }
    else{
       printf("write sucess, writelen :%d, sendMsg:%sn",writeLen,sendMsg);
    }
    close(connfd);
    return 0;
}

服务器端:

#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < unistd.h >
#include < stdio.h >
#include < stdlib.h >
#include < strings.h >
#include < sys/wait.h >
#include < string.h >
#include < errno.h >

/*
该函数能够接受指定长度(字节)的数据。循环接收,直到接受完指定数量为止。
*/
int MyRecv( int iSock, char * pchBuf, size_t tCount){
        size_t tBytesRead=0;
        int iThisRead;
        while(tBytesRead < tCount){
              do{
                     iThisRead = read(iSock, pchBuf, tCount-tBytesRead);
              } while((iThisRead< 0) && (errno==EINTR));
              if(iThisRead < 0){
                      return(iThisRead);
              }else if (iThisRead == 0)
                      return(tBytesRead);
              tBytesRead += iThisRead;
              pchBuf += iThisRead;
       }
}

#define DEFAULT_PORT 6666
int main( int argc, char ** argv){
    int sockfd,acceptfd; /* 监听socket: sock_fd,数据传输socket: acceptfd */
    struct sockaddr_in my_addr; /* 本机地址信息 */
    struct sockaddr_in their_addr; /* 客户地址信息 */
    unsigned int sin_size, myport=6666, lisnum=10;
    if ((sockfd = socket(AF_INET , SOCK_STREAM, 0)) == -1) {
       perror("socket" );
       return -1;
    }

    printf("socket ok n");
    my_addr.sin_family=AF_INET;
    my_addr.sin_port=htons(DEFAULT_PORT);
    my_addr.sin_addr.s_addr = INADDR_ANY;
    bzero(&(my_addr.sin_zero), 0);

    if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr )) == -1) {
        perror("bind" );
        return -2;
    }

    printf("bind ok n");
    if (listen(sockfd, lisnum) == -1) {
        perror("listen" );
        return -3;
    }
    printf("listen ok n");
    char recvMsg[10];
    sin_size = sizeof(my_addr);
    acceptfd = accept(sockfd,(struct sockaddr *)&my_addr,&sin_size);
    if (acceptfd < 0) {
       close(sockfd);
       printf("accept failedn" );
       return -4;
    }

    ssize_t readLen = MyRecv(acceptfd, recvMsg, sizeof( int));
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }

    int len=( int)ntohl(*( int*)recvMsg);
    printf("len:%dn",len);
    readLen = MyRecv(acceptfd, recvMsg, len);
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }
    recvMsg[len]='�';//接收到的数据并没有结束符'�',因此需要加上结束符'�
    printf("recvMsg:%sn" ,recvMsg);
    close(acceptfd);
    return 0;
  }

Makefile:

all:tcpServer tcpClient
tcpServer:tcpServer.o
	gcc -g -o tcpServer tcpServer.o
tcpClient:tcpClient.o
	gcc -g -o tcpClient tcpClient.o
tcpServer.o:tcpServer.c
	gcc -g -c tcpServer.c
tcpClient.o:tcpClient.c
	gcc -g -c tcpClient.c
clean:all
	rm all

运行截图:

图片

四、总结思考

这篇文章一个非常核心的代码就是readn和writen函数,说白了, 就一直读, 读到指定的字节数为止。其实, 在recv函数中, 最后参数如果是MSG_WAITALL, 那么就可以用recv函数一行代码, 替代上述所有代码。

大家可以对比下代码:

ssize_t readn(int fd, void *buf, int n)
{
	size_t nleft = n;   // left的意思是“剩下”, 而非“左边”
	char *bufptr = buf;
	ssize_t nread;
	while(nleft > 0)
	{
		if((nread = read(fd, bufptr, n)) < 0)
		{
			if(errno == EINTR) 	// 遇到中断
			{ 
				continue;   // 或者用 nread = 0;
			}
			else
			{
				return -1;  // 真正错误
			}
		}
		else if(nread == 0) // 对端关闭
		{
			break;
		}

		nleft -= nread;
		bufptr += nread;
	}

	return (n - nleft);
}


//一句话代码(MSG_WAITALL),前提套接字是阻塞的
 while ((num = recv(connectfd, recvbuf+buf_pos, recv_size,MSG_WAITALL)) > 0) {
 }
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据传输
    +关注

    关注

    9

    文章

    1823

    浏览量

    64464
  • 缓冲
    +关注

    关注

    0

    文章

    51

    浏览量

    17810
  • TCP
    TCP
    +关注

    关注

    8

    文章

    1348

    浏览量

    78979
  • Data
    +关注

    关注

    0

    文章

    62

    浏览量

    38234
  • 字符串
    +关注

    关注

    1

    文章

    577

    浏览量

    20485
收藏 人收藏

    评论

    相关推荐

    lwip tcp原因

    使用lwip协议栈,作为客户端应答2帧数据时,会有问题,在tcp write 后调用tcp output没有效果,设置 #define TF_NODELAY((u8_t)0x40U
    发表于 05-10 06:51

    10年的FLASH芯片是否可以使用

    公司无意进到了2007年的一批未的FALSH芯片,(nor flash),部分焊接,发现芯片还可以用,但不知道这类y存放时间过长的FLASH芯片,使用会有哪些影响,请教相关人员
    发表于 06-02 22:52

    Labview TCP通信 数据分包和处理。

    Labview的TCP通信的读函数,会发生数据分包和吗?应该怎么处理TCP读数据,官方的例子没有考虑。
    发表于 03-22 14:02

    Labview TCP通信问题

    labview的TCP通信的读函数,会发生数据分包和吗?应该怎么处理TCP读数据,官方的例子没有考虑。
    发表于 03-22 14:07

    配置能便能的粘接剂

    配置能便能的粘接剂 当遇到需要将某个元器件固定时,通常采用502胶或环氧
    发表于 09-09 15:18 759次阅读

    电烙铁不原因

    电烙铁不原因 烙铁或焊台温度过高,烙铁头表面涂布的锡快速燃烧,产生剧烈的氧化 使用不正确或是有缺陷的清洁方法 使
    发表于 02-27 12:09 5341次阅读

    TCP到底是什么

    TCP是一种流式连接,对小包会进行封包缓存发送,大包会出现分包发送。接收端就会发现接收到的数据和发送的数据的次数不一致。这个就是现象。
    的头像 发表于 02-17 17:45 4087次阅读

    用什么三极管驱动高压

    想用高压产生直流高压,可以先用振荡器将12V直流电源变为交流,然后再通过三极管驱动高压包产生高压。
    发表于 05-14 17:41 7350次阅读
    用什么三极管驱动高压<b class='flag-5'>包</b>

    tcp数据接口封装的介绍

    TCP报文格式 TCP协议有着自己的数据格式,这里把TCP的数据称为报文段(segment),TCP
    的头像 发表于 03-22 09:39 3394次阅读
    <b class='flag-5'>tcp</b>数据<b class='flag-5'>包</b>接口封装的介绍

    Linux发送HTTP网络图像 sk_buff数据结构解析

    如果你对Linux是如何实现 对用户原始的网络进行协议头封装与解析,为什么会,期间网络
    的头像 发表于 05-10 12:14 2185次阅读

    肥料粉料破包上料机械手应用优势

    肥料粉料破包上料机械手其速度是人工速度的3-5倍左右,因为可以连续作业,实际的速度可
    发表于 09-13 10:48 243次阅读

    自动投料一体机特点与应用流程

    投料一体机
    发表于 04-13 11:17 387次阅读

    【推荐】TCP为何问题如何解决?

    我们在涉及TCP协议的应用中,经常会出现的问题。所谓,简单地讲,就是我有两条消息,明明发送端的代码是分两次发送的,但是在接收端却一次
    的头像 发表于 09-23 10:00 825次阅读
    【推荐】<b class='flag-5'>TCP</b>为何<b class='flag-5'>粘</b><b class='flag-5'>包</b>?<b class='flag-5'>粘</b><b class='flag-5'>包</b>问题如何解决?

    tcp究竟会带来多大的性能问题

    一个项目对接第三方接口数据。对方是TCP接口,发送数据频率很高。平均2毫秒发送三四千个字节。由于TCP协议的
    的头像 发表于 11-08 16:16 1260次阅读
    <b class='flag-5'>tcp</b>丢<b class='flag-5'>包</b>究竟会带来多大的性能问题

    如何解决tcp通信中的问题

    一、 问题概述 1、描述背景 采用TCP协议进行网络数据传送的软件设计中,普遍存在问题。这主要是由于现代操作系统的网络传输机制所
    的头像 发表于 11-11 11:40 2072次阅读
    如何解决<b class='flag-5'>tcp</b>通信中的<b class='flag-5'>粘</b><b class='flag-5'>包</b>问题