简述数据中心网络架构的演变-电子发烧友网

芝能科技出品

随着全球对人工智能（AI）的需求不断增长，数据中心作为AI计算的重要基础设施，其网络架构与连接技术的发展变得尤为关键。

本文将简述数据中心网络架构的演变及其在AI应用中的重要性，并探讨两种主流网络架构——InfiniBand和RoCEv2。

AI生成内容（AIGC）市场在2024年迎来了爆发式增长。OpenAI发布的Sora和国内的Kimi大模型引领了这一潮流。

预计到2024年，全球对AIGC解决方案的投资将达到200亿美元，并在2027年超过1400亿美元。这种增长对AI网络架构提出了更高的要求，因其需要支撑大规模AI模型的训练和推理。

01 传统云计算与AI智算中心网络架构对比

●传统云计算数据中心网络架构

传统云计算数据中心主要基于南北向流量模型设计，即对外提供服务的流量较大，而内部东西向流量较小。

这种架构存在一些不足，例如高带宽收敛比、较高的互访时延和网卡带宽低。这些问题导致传统架构无法满足AI计算对高带宽和低时延的要求。

●AI智算中心网络架构

AI智算中心通常采用Fat-Tree（胖树）架构，通过1:1的无收敛配置，确保了高性能和无阻塞传输。此架构能够有效降低时延，并支持大规模GPU集群。

此外，AI网络架构中常用的RDMA技术，允许主机之间直接内存访问，显著降低了同集群内部的时延，提高了网络性能。

02 AI智算网络的两大主流架构

●InfiniBand网络架构

InfiniBand网络通过子网管理器（SM）进行集中管理，使用信用令牌机制确保数据在有足够缓冲区时才发送，从而避免数据丢包。其自适应路由技术能够根据数据包情况动态选择路径，实现最佳负载均衡。

●RoCEv2网络架构

RoCEv2（RDMA over Converged Ethernet）采用以太网和UDP传输层，具有更好的可扩展性和部署灵活性。其流控机制包括优先流控制（PFC）和显式拥塞通知（ECN），结合数据中心量化拥塞通知（DCQCN），能够在保持网络高效运行的同时避免数据丢失。

随着AI计算需求的增加，800G和1.6T的主流传输方案逐渐成为市场热点。

这些方案在实际应用中，尤其是单模传输和预端接技术方面，提供了创新的解决方案。

同时，为应对高能耗高热量问题，液冷解决方案也在AI数据中心得到广泛应用。

随着光模块技术向 400G 及更高速率迈进，挑战不单是提升数据传输速度，还包括功耗和成本。

从 2007 年的 10G 光模块仅需 1W 功率，到如今 400G 及 800G光模块功耗接近 30W，随着速率的每一次迭代，功耗也相应攀升。

在满载状态下，一个交换机可能搭载多达数十个光模块，48 个光模块的总功耗可达 1440W，而光模块通常占整机功耗的 40%以上，导致整个智算中心的能耗可能超过 3000W。

液冷技术因其高导热性能和高效散热能力，已成为降低网络系统能源功耗的广泛认可解决方案，特别适用于高功率密度数据中心，但需解决冷却液腐蚀性和压强差等挑战以确保系统安全。

小结

AI智算数据中心的网络架构和连接技术正朝着更高效、更低时延和更高带宽的方向发展。无论是InfiniBand还是RoCEv2，这些技术的进步都在为AI的发展提供坚实的基础。

在未来，随着技术的不断创新，AI智算网络架构将进一步优化，推动AI应用的广泛普及和深入发展。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据中心

数据中心

+关注

关注
16

文章
4613

浏览量
71864
AI

AI

+关注

关注
87

文章
29611

浏览量
267902
网络架构

网络架构

+关注

关注
1

文章
92

浏览量
12537

原文标题：数据中心的网络架构及连接技术

文章出处：【微信号：QCDZSJ，微信公众号：汽车电子设计】欢迎添加关注！文章转载请注明出处。

锐捷网络中标中国联通数据中心集采项目

　　近日，来自中国联通的官方信息显示，2016~2017年中国联通数据中心交换机设备采购招标工作已经完成。针对不同规模的数据中心场景，本次招标共分为3个标段，锐捷网络凭借雄厚的技术积累和创新能力，在

发表于 01-24 10:14

锐捷助互联网数据中心网络自动化、可视化运维

设计模式等各个方面上，国内厂商已获得相应的重要突破，逐步从技术跟随者转变为技术引领者。锐捷网络互联网系统部总经理吴吉朋指出，以锐捷为例，前几年在互联网数据中心IT架构中，锐捷还是以CDN场景和IDC里面

发表于 01-25 09:42

光模块将如何演变以适应未来数据中心需求？

。那么，数据中心应用将会给光模块带来哪些挑战呢？光模块自身又是如何演变以适应未来数据中心？光模块成本的挑战在大型数据中心中有成千上万种设备在运行。假设在一个

发表于 03-01 11:28

网络发展怎么改变企业数据中心的面貌的

云和网络规模提供商已经实施了软件定义存储、融合架构和超融合架构。以太网存储结构（ESF）技术已经成为数据中心转型不可或缺的一部分，使那些具有前瞻性思维的企业级存储

发表于 08-16 15:08

数据中心的建设也看重风水

相比中国传统的风水理论，数据中心所看重的风水则更加贴合实际。以整体架构来划分，目前的主流的数据中心已经进入第三代，并开始向第四代演进。第一代和第二代数据中心分别诞生于20世纪40和70

发表于 08-07 06:22

40G数据中心之铜缆布线

网络的互连，其中使用较多的是高速线缆（DAC，Direct Attach Copper Cable），尤其是无源铜缆（PCC）。无源铜缆因成本低和传输速度快的优点一直被视为数据中心短距离传输的最优

发表于 11-18 15:00

数据中心太耗电怎么办

！》，原文作者：启明。一、3 年电费消耗，可再建造一个数据中心！1.1 科技驱动，推动数据中心市场持续高速发展国际惯例，先介（bai）绍（du）一（bai）下（ke）“数据中心”：数据中心

发表于 06-30 06:27

数据中心是什么

数据中心是什么：数据中心是全球协作的特定设备网络，用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。

发表于 07-12 07:10

什么是数据中心

数据中心是企业用来容纳其关键业务应用程序和信息的物理设施。随着它们的发展，重要的是要长期考虑如何保持它们的可靠性和安全性。什么是数据中心？数据中心通常被称为单个事物，但实际上它们由许多技...

发表于 09-15 06:46

数据中心网络架构的HA测试[图]

设计是最基本最普遍的要求，而区别主要在于网络故障对业务恢复的快慢影响。对数据中心而言，高可用性涉及到网络、服务器、存储、电力、制冷等多个方面的因素，本文主要阐述数据中心

发表于 01-17 18:17 •1022次阅读

为什么5G网络离不开数据中心网络

5G网络采用以数据中心为基础的云化架构，承载在数据中心内独立的电信云网络上，通过SDN/NFV技术部署核心网等虚拟化网元。

发表于 12-04 10:34 •1344次阅读

数据中心与网络架构

通常来说，如果一个数据中心服务器规模超过10万台，就可以称large-scale datacenter，也就是常说的大规模数据中心。大规模数据中心对于网络的要求有很多，但是突出的就在于

发表于 09-08 13:58 •985次阅读

浅谈数据中心网络基础技术

Clos Spine/Leaf两层结构图3 常见的数据中心网络互联结构 2008年，美国加州大学圣迭戈分校的研究学者提出了将Clos架构用于数据中心中。

发表于 11-07 11:42 •984次阅读

超融合数据中心网络架构的典型特征与价值

结合业界在超融合数据中心网络技术中的实践与探索，对超融合数据中心网络架构的未来发展进行了展望。数据中心

发表于 12-19 10:53 •1628次阅读

现代数据中心SmartNIC/DPU的演变过程

随着传统IDC向云数据中心转型，数据中心网络架构开始不断演进，三层架构正过渡到Spine - Leaf架

发表于 07-19 16:11 •829次阅读

搜索历史

简述数据中心网络架构的演变

评论

锐捷网络中标中国联通数据中心集采项目

锐捷助互联网数据中心网络自动化、可视化运维

光模块将如何演变以适应未来数据中心需求？

网络发展怎么改变企业数据中心的面貌的

数据中心的建设也看重风水

40G数据中心之铜缆布线

数据中心太耗电怎么办

数据中心是什么

什么是数据中心

数据中心网络架构的HA测试[图]

为什么5G网络离不开数据中心网络

数据中心与网络架构

浅谈数据中心网络基础技术

超融合数据中心网络架构的典型特征与价值

现代数据中心SmartNIC/DPU的演变过程