0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

网卡的Ring Buffer详解

dyquk4xk2p3d 来源:良许Linux 2023-04-04 09:15 次阅读

1. 网卡处理数据包流程

网卡处理网络数据流程图:

c934603a-d278-11ed-bfe3-dac502259ad0.png

图片来自参考链接1

上图中虚线步骤的解释:

1 DMA 将 NIC 接收的数据包逐个写入 sk_buff ,一个数据包可能占用多个 sk_buff , sk_buff 读写顺序遵循FIFO(先入先出)原则。

2 DMA 读完数据之后,NIC 会通过 NIC Interrupt Handler 触发 IRQ (中断请求)。

3 NIC driver 注册 poll 函数。

4 poll 函数对数据进行检查,例如将几个 sk_buff 合并,因为可能同一个数据可能被分散放在多个 sk_buff 中。

5 poll 函数将 sk_buff 交付上层网络栈处理。

完整流程:

1 系统启动时 NIC (network interface card) 进行初始化,系统分配内存空间给 Ring Buffer 。

2 初始状态下,Ring Buffer 队列每个槽中存放的 Packet Descriptor 指向 sk_buff ,状态均为 ready。

3 DMA 将 NIC 接收的数据包逐个写入 sk_buff ,一个数据包可能占用多个 sk_buff ,sk_buff 读写顺序遵循FIFO(先入先出)原则。4 被写入数据的 sk_buff 变为 used 状态。

5 DMA 读完数据之后,NIC 会通过 NIC Interrupt Handler 触发 IRQ (中断请求)。

6 NIC driver 注册 poll 函数。

7 poll 函数对数据进行检查,例如将几个 sk_buff 合并,因为可能同一个数据可能被分散放在多个 sk_buff 中。8 poll 函数将 sk_buff 交付上层网络栈处理。

9 poll 函数清理 sk_buff,清理 Ring Buffer 上的 Descriptor 将其指向新分配的 sk_buff 并将状态设置为 ready。

2. 多 CPU 下的 Ring Buffer 处理

因为分配给 Ring Buffer 的空间是有限的,当收到的数据包速率大于单个 CPU 处理速度的时候 Ring Buffer 可能被占满,占满之后再来的新数据包会被自动丢弃。

如果在多核 CPU 的服务器上,网卡内部会有多个 Ring Buffer,NIC 负责将传进来的数据分配给不同的 Ring Buffer,同时触发的 IRQ 也可以分配到多个 CPU 上,这样存在多个 Ring Buffer 的情况下 Ring Buffer 缓存的数据也同时被多个 CPU 处理,就能提高数据的并行处理能力。

当然,要实现“NIC 负责将传进来的数据分配给不同的 Ring Buffer”,NIC 网卡必须支持 Receive Side Scaling(RSS) 或者叫做 multiqueue 的功能。RSS 除了会影响到 NIC 将 IRQ 发到哪个 CPU 之外,不会影响别的逻辑了。数据处理过程跟之前描述的是一样的。

3. Ring Buffer 相关命令

在生产实践中,因 Ring Buffer 写满导致丢包的情况很多。当环境中的业务流量过大且出现网卡丢包的时候,考虑到 Ring Buffer 写满是一个很好的思路。

总结下 Ring Buffer 相关的命令:

3.1 网卡收到的数据包统计

[root@test]$ethtool-Sem1|more
NICstatistics:
rx_packets:35874336743
tx_packets:35163830212
rx_bytes:6337524253985
tx_bytes:3686383656436
rx_broadcast:15392577
tx_broadcast:873436
rx_multicast:45849160
tx_multicast:1784024

RX 就是收到数据,TX 是发出数据。

3.2 带有 drop 字样的统计和 fifo_errors 的统计

[root@test]$ethtool-Sem1|grep-iE"error|drop"
rx_crc_errors:0
rx_missed_errors:0
tx_aborted_errors:0
tx_carrier_errors:0
tx_window_errors:0
rx_long_length_errors:0
rx_short_length_errors:0
rx_align_errors:0
dropped_smbus:0
rx_errors:0
tx_errors:0
tx_dropped:0
rx_length_errors:0
rx_over_errors:0
rx_frame_errors:0
rx_fifo_errors:79270
tx_fifo_errors:0
tx_heartbeat_errors:0
rx_queue_0_drops:16669
rx_queue_1_drops:21522
rx_queue_2_drops:0
rx_queue_3_drops:5678
rx_queue_4_drops:5730
rx_queue_5_drops:14011
rx_queue_6_drops:15240
rx_queue_7_drops:420

发送队列和接收队列 drop 的数据包数量显示在这里。并且所有 queue_drops 加起来等于 rx_fifo_errors。所以总体上能通过 rx_fifo_errors 看到 Ring Buffer 上是否有丢包。如果有的话一方面是看是否需要调整一下每个队列数据的分配,或者是否要加大 Ring Buffer 的大小。

3.3 查询 Ring Buffer 大小

[root@test]$ethtool-gem1
Ringparametersforem1:
Pre-setmaximums:
RX:4096
RXMini:0
RXJumbo:0
TX:4096
Currenthardwaresettings:
RX:256
RXMini:0
RXJumbo:0
TX:256

RX 和 TX 最大是 4096,当前值为 256 。队列越大丢包的可能越小,但数据延迟会增加。

3.4 调整 Ring Buffer 队列数量

[root@test]$ethtool-lem1
Channelparametersforem1:
Pre-setmaximums:
RX:0
TX:0
Other:1
Combined:8
Currenthardwaresettings:
RX:0
TX:0
Other:1
Combined:8

Combined = 8,说明当前 NIC 网卡会使用 8 个进程处理网络数据。

更改 eth0 网卡 Combined 的值:

ethtool -L eth0 combined 8

需要注意的是,ethtool 的设置操作可能都要重启一下才能生效。

3.4 调整 Ring Buffer 队列大小查看当前 Ring Buffer 大小:

[root@test]$ethtool-gem1
Ringparametersforem1:
Pre-setmaximums:
RX:4096
RXMini:0
RXJumbo:0
TX:4096
Currenthardwaresettings:
RX:256
RXMini:0
RXJumbo:0
TX:256

看到 RX 和 TX 最大是 4096,当前值为 256。队列越大丢包的可能越小,但数据延迟会增加.

设置 RX 和 TX 队列大小:

ethtool -G em1 rx 4096

ethtool -G em1 tx 4096

3.5 调整 Ring Buffer 队列的权重

NIC 如果支持 mutiqueue 的话 NIC 会根据一个 Hash 函数对收到的数据包进行分发。能调整不同队列的权重,用于分配数据。

[root@test]$ethtool-xem1
RXflowhashindirectiontableforem1with8RXring(s):
0:00000000
8:00000000
16:11111111
24:11111111
32:22222222
40:22222222
48:33333333
56:33333333
64:44444444
72:44444444
80:55555555
88:55555555
96:66666666
104:66666666
112:77777777
120:77777777
RSShashkey:
Operationnotsupported

我的 NIC 一共有 8 个队列,一共有 128 个不同的 Hash 值,上面就是列出了每个 Hash 值对应的队列是什么。最左侧 0 8 16 是为了能让你快速的找到某个具体的 Hash 值。比如 Hash 值是 76 的话我们能立即找到 72 那一行:"72: 4 4 4 4 4 4 4 4",从左到右第一个是 72 数第 5 个就是 76 这个 Hash 值对应的队列是 4 。

设置 8 个队列的权重。加起来不能超过 128 。128 是 indirection table 大小,每个 NIC 可能不一样。

3.6 更改 Ring Buffer Hash Field

分配数据包的时候是按照数据包内的某个字段来进行的,这个字段能进行调整。

[root@test]$ethtool-nem1rx-flow-hashtcp4
TCPoverIPV4flowsusethesefieldsforcomputingHashflowkey:
IPSA
IPDA
L4bytes0&1[TCP/UDPsrcport]
L4bytes2&3[TCP/UDPdstport]

也可以设置 Hash 字段:查看 tcp4 的 Hash 字段。

ethtool -N em1 rx-flow-hash udp4 sdfn

sdfn 需要查看 ethtool 看其含义,还有很多别的配置值。

3.6 IRQ 统计

/proc/interrupts 能看到每个 CPU 的 IRQ 统计。一般就是看看 NIC 有没有支持 multiqueue 以及 NAPI 的 IRQ 合并机制是否生效。看看 IRQ 是不是增长的很快。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网卡
    +关注

    关注

    4

    文章

    307

    浏览量

    27374
  • fifo
    +关注

    关注

    3

    文章

    387

    浏览量

    43646
  • 函数
    +关注

    关注

    3

    文章

    4327

    浏览量

    62566
  • dma
    dma
    +关注

    关注

    3

    文章

    560

    浏览量

    100541
  • NIC
    NIC
    +关注

    关注

    0

    文章

    23

    浏览量

    12415

原文标题:网卡的 Ring Buffer 详解

文章出处:【微信号:良许Linux,微信公众号:良许Linux】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    网卡知识详解

    网卡知识详解关于网卡名称       计算机与外界局域网的连接是通过主机箱内插入一块网络接口板(或者是在笔记本电脑中插入一块
    发表于 06-30 22:50

    网卡芯片详解

    网卡芯片详解1.RTL8139D  8139/8139A/8139B/8139C/8139C+/8139D/8130/810X/8169/8110系列网卡是市场上最常见的网卡芯片产品,
    发表于 10-19 13:28

    Ring Buffer 有什么特别?

    首先 - Ring Buffer。我对 Disruptor 的最初印象只有 Ring Buffer。后来我渐渐明白 Ring
    发表于 05-25 00:41

    什么是Resilient Packet Ring

    什么是Resilient Packet Ring    英文缩写: Resilient Packet Ring 中文译名: 弹性分组环
    发表于 02-23 09:31 623次阅读

    粉红圈(pink ring),粉红圈(pink ring)是

    粉红圈(pink ring)定义成因/影响/改善 粉红圈(pink ring)的定义 板面在氧化后,生成一绒毛层(氧化铜及氧化亚铜)。在本质
    发表于 03-27 16:27 2636次阅读

    linux下网卡配置详解

    linux下网卡配置详解
    发表于 12-15 22:38 0次下载

    Ring buffer介绍

    首先 - Ring Buffer。我对 Disruptor 的最初印象只有 Ring Buffer。后来我渐渐明白 Ring
    发表于 04-02 14:32 3218次阅读

    BPF ring buffer解决的问题及背后的设计

    文章介绍了 BPF ring buffer 解决的问题及背后的设计,并给出了一些代码示例和内核 patch 链接,深度和广度兼备,是学习 ring buffer 的极佳参考。
    的头像 发表于 05-17 09:37 2275次阅读

    Ring Clojure的Web框架

    ./oschina_soft/ring.zip
    发表于 06-13 09:38 1次下载
    <b class='flag-5'>Ring</b> Clojure的Web框架

    网卡Ring Buffer详解

    DMA 将 NIC 接收的数据包逐个写入 sk_buff ,一个数据包可能占用多个 sk_buff , sk_buff 读写顺序遵循FIFO(先入先出)原则。
    的头像 发表于 03-17 14:25 1526次阅读

    简述linux系统UDP丢包问题分析思路(上)

    在开始之前,我们先用一张图解释 linux 系统接收网络报文的过程。 1. 首先网络报文通过物理网线发送到网卡 2. 网络驱动程序会把网络中的报文读出来放到 ring buffer 中,这个
    的头像 发表于 05-18 17:24 2760次阅读
    简述linux系统UDP丢包问题分析思路(上)

    简述linux系统UDP丢包问题分析思路(下)

    在开始之前,我们先用一张图解释 linux 系统接收网络报文的过程。 1. 首先网络报文通过物理网线发送到网卡 2. 网络驱动程序会把网络中的报文读出来放到 ring buffer 中,这个
    的头像 发表于 05-18 17:25 1500次阅读

    多CPU下的Ring Buffer处理

    1. 网卡处理数据包流程 一图胜千言,先来看看网卡处理网络数据流程图: 图片来自参考链接1 上图中虚线步骤的解释: 1 DMA 将 NIC 接收的数据包逐个写入 sk_buff ,一个数据包可能占用
    的头像 发表于 06-22 10:13 864次阅读
    多CPU下的<b class='flag-5'>Ring</b> <b class='flag-5'>Buffer</b>处理

    物联网卡的流量到底是什么?超全详解

    物联网卡的流量到底是什么?超全详解
    的头像 发表于 08-31 09:13 2372次阅读
    物联<b class='flag-5'>网卡</b>的流量到底是什么?超全<b class='flag-5'>详解</b>!

    MSPM0 UART通信中DMA和Ring Buffer环形缓冲的应用

    电子发烧友网站提供《MSPM0 UART通信中DMA和Ring Buffer环形缓冲的应用.pdf》资料免费下载
    发表于 09-05 11:01 0次下载
    MSPM0 UART通信中DMA和<b class='flag-5'>Ring</b> <b class='flag-5'>Buffer</b>环形缓冲的应用