为什么我抓不到baidu的数据包-电子发烧友网

最近，有位读者问起一个奇怪的事情，他说他想抓一个baidu.com的数据包，体验下看包的乐趣。

但却发现“抓不到”，这就有些奇怪了。

我来还原下他的操作步骤。

首先，通过ping命令，获得访问百度时会请求哪个IP。

$pingbaidu.com
PINGbaidu.com(39.156.66.10)56(84)bytesofdata.
64bytesfrom39.156.66.10(39.156.66.10):icmp_seq=1ttl=49time=30.6ms
64bytesfrom39.156.66.10(39.156.66.10):icmp_seq=2ttl=49time=30.6ms
64bytesfrom39.156.66.10(39.156.66.10):icmp_seq=3ttl=49time=30.6ms

从上面的结果可以知道请求baidu.com时会去访问39.156.66.10。

于是用下面的tcpdump命令进行抓包，大概的意思是抓eth0网卡且ip为39.156.66.10的网络包，保存到baidu.pcap文件中。

$tcpdump-ieth0host39.156.66.10-wbaidu.pcap

此时在浏览器中打开baidu.com网页。或者在另外一个命令行窗口，直接用curl命令来模拟下。

$curl'https://baidu.com'

按理说，访问baidu.com的数据包肯定已经抓下来了。

然后停止抓包。

再用wireshark打开baidu.pcap文件，在过滤那一栏里输入http.host == "baidu.com"。

此时发现，一无所获。

在wireshark中搜索baidu的包，发现一无所获

这是为啥？

到这里，有经验的小伙伴，其实已经知道问题出在哪里了。

为什么没能抓到包

这其实是因为他访问的是HTTPS协议的baidu.com。HTTP协议里的Host和实际发送的request body都会被加密。

正因为被加密了，所以没办法通过http.host进行过滤。

但是。

虽然加密了，如果想筛选还是可以筛的。

HTTPS握手中的Client Hello阶段，里面有个扩展server_name，会记录你想访问的是哪个网站，通过下面的筛选条件可以将它过滤出来。

tls.handshake.extensions_server_name=="baidu.com"

通过tls的扩展server_name可以搜索到baidu的包

此时选中其中一个包，点击右键，选中Follow-TCP Stream。

右键找到tcp 流

这个TCP连接的其他相关报文全都能被展示出来。

HTTPS抓包

从截图可以看出，这里面完整经历了TCP握手和TLS加密握手流程，之后就是两段加密信息和TCP挥手流程。

可以看出18号和20号包，一个是从端口56028发到443，一个是443到56028的回包。

一般来说，像56028这种比较大且没啥规律的数字，都是客户端随机生成的端口号。

而443，则是HTTPS的服务器端口号。

HTTP用的是80端口，如果此时对着80端口抓包，也会抓不到数据。

粗略判断，18号和20号包分别是客户端请求baidu.com的请求包和响应包。

点进去看会发现URL和body都被加密了，一无所获。

那么问题就来了。有没有办法解密里面的数据呢？

有办法。我们来看下怎么做。

解密数据包

还是先执行tcpdump抓包

$tcpdump-ieth0host39.156.66.10-wbaidu.pcap

然后在另外一个命令行窗口下执行下面的命令，目的是将加密的key导出，并给出对应的导出地址是/Users/xiaobaidebug/ssl.key。

$exportSSLKEYLOGFILE=/Users/xiaobaidebug/ssl.key

然后在同一个命令行窗口下，继续执行curl命令或用命令行打开chrome浏览器。目的是为了让curl或chrome继承这个环境变量。

$curl'https://baidu.com'
或者
$open-aGoogleChrome#在mac里打开chrome浏览器

此时会看到在/Users/xiaobaidebug/下会多了一个ssl.key文件。

这时候跟着下面的操作修改wireshark的配置项。

打开wireshark的配置项

找到Protocols之后，使劲往下翻，找到TLS那一项。

在配置项中找到Protocols

将导出的ssl.key文件路径输入到这里头。

在Protocols中找到TLS那一栏

点击确定后，就能看到18号和20号数据包已经被解密。

解密后的数据包内容

此时再用http.host == "baidu.com"，就能过滤出数据了。

解密后的数据包中可以过滤出baidu的数据包

到这里，其实看不了数据包的问题就解决了。

但是，新的问题又来了。

ssl.key文件是个啥？

这就要从HTTPS的加密原理说起了。

HTTPS握手过程

HTTPS的握手过程比较繁琐，我们来回顾下。

先是建立TCP连接，毕竟HTTP是基于TCP的应用层协议。

在TCP成功建立完协议后，就可以开始进入HTTPS阶段。

HTTPS可以用TLS或者SSL啥的进行加密，下面我们以TLS1.2为例。

总的来说。整个加密流程其实分为两阶段。

第一阶段是TLS四次握手，这一阶段主要是利用非对称加密的特性各种交换信息，最后得到一个"会话秘钥"。

第二阶段是则是在第一阶段的"会话秘钥"基础上，进行对称加密通信。

TLS四次握手

我们先来看下第一阶段的TLS四次握手是怎么样的。

第一次握手：

•Client Hello：是客户端告诉服务端，它支持什么样的加密协议版本，比如TLS1.2，使用什么样的加密套件，比如最常见的RSA，同时还给出一个客户端随机数。

第二次握手：

•Server Hello：服务端告诉客户端，服务器随机数+ 服务器证书 + 确定的加密协议版本（比如就是TLS1.2）。

第三次握手：

•Client Key Exchange: 此时客户端再生成一个随机数，叫pre_master_key。从第二次握手的服务器证书里取出服务器公钥，用公钥加密pre_master_key，发给服务器。
•Change Cipher Spec: 客户端这边已经拥有三个随机数：客户端随机数，服务器随机数和pre_master_key，用这三个随机数进行计算得到一个"会话秘钥"。此时客户端通知服务端，后面会用这个会话秘钥进行对称机密通信。
•Encrypted Handshake Message：客户端会把迄今为止的通信数据内容生成一个摘要，用"会话秘钥"加密一下，发给服务器做校验，此时客户端这边的握手流程就结束了，因此也叫Finished报文。

第四次握手：

•Change Cipher Spec：服务端此时拿到客户端传来的pre_master_key（虽然被服务器公钥加密过，但服务器有私钥，能解密获得原文），集齐三个随机数，跟客户端一样，用这三个随机数通过同样的算法获得一个"会话秘钥"。此时服务器告诉客户端，后面会用这个"会话秘钥"进行加密通信。
•Encrypted Handshake Message：跟客户端的操作一样，将迄今为止的通信数据内容生成一个摘要，用"会话秘钥"加密一下，发给客户端做校验，到这里，服务端的握手流程也结束了，因此这也叫Finished报文。

四次握手中，客户端和服务端最后都拥有三个随机数，他们很关键，我特地加粗了表示。

第一次握手，产生的客户端随机数，叫client random。

第二次握手时，服务器也会产生一个服务器随机数，叫server random。

第三次握手时，客户端还会产生一个随机数，叫pre_master_key。

这三个随机数共同构成最终的对称加密秘钥，也就是上面提到的"会话秘钥"。

三个随机数生成对称秘钥

你可以简单的认为，只要知道这三个随机数，你就能破解HTTPS通信。

而这三个随机数中，client random和server random都是明文的，谁都能知道。而pre_master_key却不行，它被服务器的公钥加密过，只有客户端自己，和拥有对应服务器私钥的人能知道。

所以问题就变成了，怎么才能得到这个pre_master_key？

怎么得到pre_master_key

服务器私钥不是谁都能拿到的，所以问题就变成了，有没有办法从客户端那拿到这个pre_master_key。

有的。

客户端在使用HTTPS与服务端进行数据传输时，是需要先基于TCP建立HTTP连接，然后再调用客户端侧的TLS库（OpenSSL、NSS）。触发TLS四次握手。

这时候如果加入环境变量SSLKEYLOGFILE就可以干预TLS库的行为，让它输出一份含有pre_master_key的文件。这个文件就是我们上面提到的/Users/xiaobaidebug/ssl.key。

将环境变量注入到curl和chrome中

但是，虽然TLS库支持导出key文件。但前提也是，上层的应用程序在调用TLS库的时候，支持通过SSLKEYLOGFILE环境触发TLS库导出文件。实际上，也并不是所有应用程序都支持将SSLKEYLOGFILE。只是目前常见的curl和chrome浏览器都是支持的。

SSLKEYLOGFILE文件内容

再回过头来看ssl.key文件里的内容。

#SSL/TLSsecretslogfile,generatedbyNSS
CLIENT_RANDOM5709aef8ba36a8eeac72bd6f970a74f7533172c52be41b200ca9b91354bd662b09d156a5e6c0d246549f6265e73bda72f0d6ee81032eaaa0bac9bea362090800174e0effc93b93c2ffa50cd8a715b0f0
CLIENT_RANDOM57d269386549a4cec7f91158d85ca1376a060ef5a6c2ace04658fe88aec4877648c16429d362bea157719da5641e2f3f13b0b3fee2695ef2b7cdc71c61958d22414e599c676ca96bbdb30eca49eb488a
CLIENT_RANDOM5fca0f2835cbb5e248d7b3e75180b2b3aff000929e33e5bacf5f5a4bff63bbe5424e1fcfff35e76d5bf88f21d6c361ee7a9d32cb8f2c60649135fd9b66d569d8c4add6c9d521e148c63977b7a95e8fe8
CLIENT_RANDOMbe610cb1053e6f3a01aa3b88bc9e8c77a708ae4b0f953b2063ca5f925d673140c26e3cf83513a830af3d3401241e1bc4fdda187f98ad5ef9e14cae71b0ddec85812a81d793d6ec934b9dcdefa84bdcf3

这里有三列。

第一列是CLIENT_RANDOM，意思是接下来的第二列就是客户端随机数，再接下来的第三列则是pre_master_key。

但是问题又来了。

这么多行，wireshark怎么知道用哪行的pre_master_key呢？

wireshark是可以获得数据报文上的client random的。

比如下图这样。

Client Hello 里的客户端随机数

注意上面的客户端随机数是以"bff63bbe5"结尾的。

同样，还能在数据报文里拿到server random。

找到server random

此时将client random放到ssl.key的第二列里挨个去做匹配。

就能找到对应的那一行记录。

ssl.key里的数据

注意第二列的那串字符串，也是以"bff63bbe5"结尾的，它其实就是前面提到的client random。

再取出这一行的第三列数据，就是我们想要的pre_master_key。

那么这时候wireshark就集齐了三个随机数，此时就可以计算得到会话秘钥，通过它对数据进行解密了。

反过来，正因为需要客户端随机数，才能定位到ssl.key文件里对应的pre_master_key是哪一个。而只有TLS第一次握手（client hello）的时候才会有这个随机数，所以如果你想用解密HTTPS包，就必须将TLS四次握手能抓齐，才能进行解密。如果连接早已经建立了，数据都来回传好半天了，这时候你再去抓包，是没办法解密的。

总结

•文章开头通过抓包baidu的数据包，展示了用wireshark抓包的简单操作流程。
•HTTPS会对HTTP的URL和Request Body都进行加密，因此直接在filter栏进行过滤http.host == "baidu.com"会一无所获。
• HTTPS握手的过程中会先通过非对称机密去交换各种信息，其中就包括3个随机数，再通过这三个随机数去生成对称机密的会话秘钥，后续使用这个会话秘钥去进行对称加密通信。如果能获得这三个随机数就能解密HTTPS的加密数据包。
•三个随机数，分别是客户端随机数（client random），服务端随机数（server random）以及pre_master_key。前两个，是明文，第三个是被服务器公钥加密过的，在客户端侧需要通过SSLKEYLOGFILE去导出。
•通过设置SSLKEYLOGFILE环境变量，再让curl或chrome会请求HTTPS域名，会让它们在调用TLS库的同时导出对应的sslkey文件。这个文件里包含了三列，其中最重要的是第二列的client random信息以及第三列的pre_master_key。第二列client random用于定位，第三列pre_master_key用于解密。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

命令

命令

+关注

关注
5

文章
698

浏览量
22145
数据包

数据包

+关注

关注
0

文章
268

浏览量
24535

原文标题：为什么我抓不到baidu的数据包

文章出处：【微信号：良许Linux，微信公众号：良许Linux】欢迎添加关注！文章转载请注明出处。

I2C总线数据包结构详解

。以下是I2C总线数据包结构的详解：一、I2C总线数据包的基本组成 I2C总线上的数据传输以数据包为单位进行，每个数据包包含起始信号、设备

发表于 01-17 15:46 •213次阅读

mtu配置步骤详解 mtu与数据包丢失的关系

MTU（Maximum Transmission Unit）即最大传输单元，是指一种通信协议的某一层上面所能通过的最大数据报大小，单位是字节。MTU配置步骤及其与数据包丢失的关系如下： MTU配置

发表于 12-16 14:33 •1214次阅读

请问DCTCP与DCUDP 的登录数据包和心跳数据包与服务器端是如何交互的？

DCTCP与DCUDP的登录数据包和心跳数据包与服务器端是如何交互的？

发表于 07-25 06:37

经典蓝牙抓包解析说明

在无线通信协议的开发过程中，抓包器是工程师们不可或缺的工具。掌握抓包器的使用，就如同拥有了能够洞察无线电波的“火眼金睛”。这不仅使我们能够验证发出的

发表于 07-24 09:04 •2260次阅读

esp8266怎么做才能每秒发送更多的数据包呢？

数据包的速度，即每秒大约 50 个 UDP 数据包。高波特率唯一改变的是，在数据包较大的情况下，我可以以与轻量级数据包相同的速度发送

发表于 07-22 08:00

使用AT SAVETRANSLINK时UDP数据包丢失怎么解决？

。我的微控制器发回的所有数据包都会被 Android 接收。到目前为止没有丢包。但是，一段时间后（半小时或更短的时间），Android 没有收到我的微控制器发送的一些数据包。接收

发表于 07-18 07:17

能否在ESP结束之前通过串行端口停止传入的UDP数据包的传输以解析下一个UDP数据包？

我正在做一个artnet节点，它收到几个 UDP 广播数据包，工作正常，但是：其中一些必须使用，其中一些必须丢弃， mi问题是：所有传入的数据包都出现在带有IPD命令的串行端口上，并且我

发表于 07-16 06:18

请问如何使用AT CIPSEND或AT CIPSENDBUF发送多个数据包？

我可以使用 AT CIPSEND 发送单个数据包。但是我必须发送一系列二进制数据包。如何使用AT CISEND或AT CIPSENDBUF发送多个数

发表于 07-15 07:37

NONOS如何检查是否实际发送了UDP数据包？

我发现进入深度睡眠通常无法传输发送的最后一个 UDP 数据包。我现在将睡眠延迟 30 毫秒，这是一个黑客。我宁愿有一种方法来检查是否可以休眠，或者以其他方式能够注册指示

发表于 07-12 06:14

在AN65974中短数据包和零长数据包是什么意思？

在 AN65974 中，短数据包和零长数据包是什么意思？非常感谢！

发表于 05-30 07:41

如何在AIROC GUI上获取良好数据包和总数据包？

使用 IQxel-MW LifePoint 作为发生器并发送波形BT_1DH5_00001111_Fs80M.iqvsg，但无法在 AIROC 工具中接收数据包。以下是从 IQxel 发送

发表于 05-22 06:39

请问高端网络芯片如何处理数据包呢？

随着网络芯片带宽的持续提升，其内部数据包处理单元的工作负载也随之增加。然而，如果处理单元无法与网络接口的传入速率相匹配，将无法及时处理数据包，这不仅会导致数据包随机丢失，更会降低网络的吞吐量。

发表于 04-02 16:36 •730次阅读

STM32H750如何提高数据包大小？

我使用STM32H750官方的VCP例程，FS模式。程序默认CDC_DATA_FS_MAX_PACKET_SIZE是64位，我试着修改最大只能到256，如果再大会导致接收不到数据。芯

发表于 03-07 06:12

DPDK在AI驱动的高效数据包处理应用

传统的数据包处理方式是数据包先到内核最后再到用户层进行处理。这种方式会增加额外的延迟和CPU开销，严重影响数据包处理的性能。 DPDK 绕过内核，在用户空间中实现快速数据包处理。

发表于 02-25 11:28 •1097次阅读

搜索历史

为什么我抓不到baidu的数据包

为什么没能抓到包

解密数据包

HTTPS握手过程

怎么得到pre_master_key

SSLKEYLOGFILE文件内容

总结

评论

I2C总线数据包结构详解

mtu配置步骤详解 mtu与数据包丢失的关系

CentOS中使用tcpdump抓包

请问DCTCP与DCUDP 的登录数据包和心跳数据包与服务器端是如何交互的？

经典蓝牙抓包解析说明

esp8266怎么做才能每秒发送更多的数据包呢？

使用AT SAVETRANSLINK时UDP数据包丢失怎么解决？

能否在ESP结束之前通过串行端口停止传入的UDP数据包的传输以解析下一个UDP数据包？

请问如何使用AT CIPSEND或AT CIPSENDBUF发送多个数据包？

NONOS如何检查是否实际发送了UDP数据包？

在AN65974中短数据包和零长数据包是什么意思？

如何在AIROC GUI上获取良好数据包和总数据包？

请问高端网络芯片如何处理数据包呢？

STM32H750如何提高数据包大小？

DPDK在AI驱动的高效数据包处理应用