智算中心网络交换机需要什么样的缓存架构-电子发烧友网

‍在交换机上，缓存就是数据交换的缓冲区，被交换机用来协调不同网络设备之间的速度匹配问题，突发数据可以存储在缓冲区内，直到被慢速设备处理为止。数据中心交换机应用在HPC/AI大模型训练、分布式存储等场景时，并非缓存越大越好，过大的缓存会导致更长的队列、更高的时延和抖动、更高的成本，所以不能简单地去扩大缓存，交换机避免丢包所需的缓存与此带宽延迟积BDP直接相关，借助于带宽时延积BDP可以确定合适的内存大小。

缓存架构分类

按照缓冲区的大小，以太网交换机通常分为深缓冲区交换机和浅缓冲区交换机，深缓冲区交换机缓冲区容量高达数GB，与浅缓冲区交换机的几十MB形成鲜明对比。这种设计上的差异源于应用场景的差异，深缓冲区交换机（或路由器）主要面向路由和广域网场景，RTT时间长，希望能够容纳更多的数据流量，对微突发流量不敏感，但也意味着更高的尾延迟和抖动，这一点与HPC/AI大模型训练、分布式存储等场景的低时延要求显然是相违背的，浅缓冲区交换机在这种场景下更适合，以目前最高端的51.2Tbps（64个800G）的交换机为例，如果RTT时间是3~5微秒，缓存仅需33MB左右，这是交换机中所需的总缓存，那么这个总的缓存能否被每一个端口充分利用吗？

这就取决于交换机（交换芯片）所采用缓存架构。交换芯片的缓存架构通常分为：完全共享缓存架构和分片报文缓存架构（也称分割缓冲区结构）。

完全共享缓存架构：设备中的所有缓存都可用于动态分配到任何端口，意味着在所有输入-输出端口之间共享缓存而没有任何限制，最大限度地提高了可用内存的效率。

分片报文缓存架构：由多片较小的缓存共同组成了芯片内部的缓存，所有的物理接口也被划分成了不同的组，同一组内的物理接口共享对应的缓存单元。

不同缓存架构影响

如下图所示，同样是16MB的缓存情况下，完全共享缓冲架构中的每个端口极限情况下（如多打一的Incast场景，）可以最大利用到16MB；如果是两个分片的分组端口缓存架构下，每个端口极限情况下仅可以最大利用到8MB；而如果是四个分片的分组端口缓存架构下，每个端口极限情况下仅可以最大利用到4MB。

思科之前的文档中也做过分析，分片报文缓存架构下，不同的流量模型对微突发流量吸收的影响或限制也不同，如下图所示：

以图中右侧图示情况为例，4个分片的架构下，如果四个输出端口位于4个不同的分片上，最理想的情况可以达到100%的缓存利用，但是任意一个输出端口最多仅可以消耗总内存的25%。在复杂的流量模式下，这种限制可能会更加痛苦，如图中右侧图示为例，此情况下，一个输出端口的缓存被限制为总缓冲区的1/16（6.25%），这种限制使得Incast下的缓冲行为不可预测。在完全共享缓存架构中，设备中的所有数据包缓冲区都可用于动态分配到任意一个端口，这意味着在所有输入输出端口之间共享缓存而没有任何限制，最大限度地提高了可用内存的效率，并且使微突发流量吸收能力可预测，与流量模型没有任何关系。

完全共享缓存的优势也体现在RoCEv2网络中，RoCEv2是TCP/IP协议中UDP层实现，因为使用不需要确认的UDP协议，此时RTT不是缓冲区需求的直接驱动因素，但是RDMA的无损特性往往要依靠PFC来实现，PFC逐级反压控制会导致拥塞蔓延，完全共享缓存通过在需要的时间和节点支持更多的缓存，有助于最大限度地减少触发PFC流量控制的需要。

主流厂商实现当前市场上，大多数数据中心交换机都是使用商用交换芯片ASIC构建的，这些ASIC针对传统的数据流量模式和数据包大小进行了成本优化，为了在实现带宽目标的同时保持低成本，芯片供应商更多使用了分片缓存架构，牺牲了公平性，同时面临不可预测性和微突发吸收的问题。

但是，当前几个主要厂商51.2Tbps最高容量的交换芯片，由于应对场景以HPC/AI大模型训练等为主，基本都采用完全共享缓存架构，相关的交换芯片或交换机如博通Tomahawk5、英伟达Spectrum-4、思科Silicon One G200都是宣传采用完全共享缓存架构。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

网络交换机

网络交换机

+关注

关注
1

文章
67

浏览量
16037
缓存

缓存

+关注

关注
1

文章
239

浏览量
26665
智算中心

智算中心

+关注

关注
0

文章
67

浏览量
1688

原文标题：智算中心网络交换机需要什么样的缓存架构？

文章出处：【微信号：SDNLAB，微信公众号：SDNLAB】欢迎添加关注！文章转载请注明出处。

广西南宁企业级综合网关、网络核心交换机等售后维修服务中心点深妙科技

随着信息技术的迅猛发展，云计算和网络架构的复杂性日益增加，核心交换机作为网络的中心节点，担负着至关重要的角色。本文旨在探讨云管框式核心

发表于 12-18 15:41 •39次阅读

广西南宁企业级综合网关、<b class='flag-5'>网络</b>核心<b class='flag-5'>交换机</b>等售后维修服务<b class='flag-5'>中心</b>点深妙科技

反射内存交换机与普通交换机的区别

，实现低延迟、确定性的数据传输。普通交换机则依据网络协议（如以太网协议）进行数据转发，通常需要软件参与处理，数据传输的延迟和确定性相对较难保证。传输速度和延迟：反射

发表于 09-05 09:57 •553次阅读

反射内存<b class='flag-5'>交换机</b>与普通<b class='flag-5'>交换机</b>的区别

网管型交换机和非网管型交换机的区别

网管型交换机和非网管型交换机是两种不同类型的交换机，它们在功能、性能、应用场景等方面存在明显的差异。定义网管型交换机（Managed Switch）是一种具有

发表于 08-05 15:41 •2577次阅读

园区交换机 VS 数据中心交换机

园区交换机和数据中心交换机是交换机领域的两大类别，很多人都很熟悉。但是，这两者之间的区别并不是很清楚。在本文中，我们将对园区交换机和数据

发表于 06-24 15:33 •594次阅读

园区<b class='flag-5'>交换机</b> VS 数据<b class='flag-5'>中心</b><b class='flag-5'>交换机</b>

数据中心交换机购买指南

由于数据中心网络基础设施变得更加分散，数据中心交换机正在成为一种新型交换机。与传统的三层架构

发表于 06-11 16:37 •515次阅读

广域网交换机与局域网交换机的区别

　　在构建和管理网络架构时，交换机作为核心设备，其选择和配置直接影响到网络的性能、可靠性和安全性。广域网交换机和局域网

发表于 06-06 11:07 •1029次阅读

交换机的基本分类

　　交换机作为网络通讯中的核心设备之一，其在网络架构中起着至关重要的作用。随着信息技术的飞速发展，交换机也在不断演进和革新，以满足日益复杂的

发表于 06-06 11:06 •1864次阅读

浅谈交换机的发展历史

　　交换机作为网络通讯中的关键设备，其发展历程见证了信息技术的飞速进步和网络架构的持续优化。从早期的电路交换到现代的以太网

发表于 06-06 11:05 •2011次阅读

光纤交换机和网络交换机的区别在哪

光纤交换机和网络交换机是两种不同类型的网络设备，它们在数据传输介质、传输速率、应用场景以及设计上有所区别。

发表于 05-28 15:16 •2214次阅读

交换机芯片架构的演变

交换机芯片架构的演变是随着网络技术的发展和数据处理需求的增长而逐步推进的。

发表于 03-26 15:03 •749次阅读

工业网络交换机的分类及其应用领域

工业网络交换机作为关键的通信设备，在工业领域扮演着至关重要的角色。根据不同的需求和应用场景，工业网络交换机可以分为多个分类。本文将围绕工业网络

发表于 03-26 10:02 •822次阅读

交换机分布缓存_述说数据中心交换机的重要性能指标——缓存

交换机是数据中心不可缺少的网络设备，在数据中心里发挥着重要作用。在平时使用和采购时，大多数都关注交换机的背板带宽、端口密度、单端口速度、协议

发表于 03-15 17:39 •762次阅读

汇聚交换机和核心交换机区别

汇聚交换机和核心交换机是网络中常见的两种交换机设备，在网络中扮演着不同的角色和功能。虽然它们的主要目标是提供高速、高效的数据

发表于 01-22 14:32 •4364次阅读

万兆铜缆交换机与万兆光纤交换机有什么区别？该如何选择？

万兆铜缆交换机与万兆光纤交换机有什么区别？该如何选择？万兆铜缆交换机和万兆光纤交换机是网络通信领域中常见的两种设备，它们在性能、适用场景、

发表于 12-27 15:02 •855次阅读

管理型交换机 vs. 非管理型交换机

在构建复杂的网络中，选择适当的交换机类型很重要。管理型交换机作为智能网络的掌舵者，与非管理型交换机相比，为

发表于 12-25 17:59 •1277次阅读

搜索历史

智算中心网络交换机需要什么样的缓存架构

评论