0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过网络技术和NetDevOps优化数据中心网络

星星科技指导员 来源:NVIDIA 作者:Rama Darbha 2022-05-30 10:02 次阅读

通过以下两种方式更新关键网络架构,可以优化数据中心:通过网络技术或 NetDevOps 中的操作效率。在本文中,我们将确定并评估可应用于网络体系结构以优化网络的技术。

我们将介绍五个更新,您应该考虑这些更新来改进数据中心:

用 VXLAN 替换第 2 层 VLAN

使用地址解析协议( ARP )抑制来减少广播传播。

将多机箱链路聚合组( MLAG )替换为 EVPN 多主。

使用等成本多路径( ECMP )路由和 UCMP 处理流量平衡。

通过自适应路由适应交通极化。

用 VXLAN 替换 VLAN

VXLAN 是一种覆盖技术,它使用封装允许第二层覆盖 VLAN 跨第三层网络。第 2 层网络有一些固有的缺点:

由于它们依赖生成树协议( STP ),冗余和多路径的能力受到生成树功能的限制。

它们只能在一个子网内运行,由于 MLAG ,冗余通常仅限于两个设备。

任何路径级冗余都需要链路聚合控制协议( LACP ),这是端口的标准冗余技术。

VXLAN 克服了这些缺陷,允许网络运营商在第 3 层路由结构上进行优化。仍然可以实现第 2 层覆盖,但由于依赖 EVPN 作为控制平面,因此不再需要生成树来进行控制平面收敛。

EVPN 通过 BGP 地址族交换 MAC 信息,而不是依赖广播泛洪和学习的低效性。此外, VXLAN 使用 24 位 ID ,可定义多达 1600 万个虚拟网络,而 VLAN 只有 12 位 ID ,仅限于 4094 个虚拟网络。

使用 ARP 抑制来减少广播传播

使用 VXLAN 的数据中心中的广播流量可以通过 ARP 抑制进一步优化。 ARP 抑制通过使用 EVPN 将 ARP 请求的响应直接从 ToR 虚拟隧道端点( VTEP )代理给客户端,帮助减少通信量。

在没有 ARP 抑制的情况下,所有 ARP 请求将在整个 VXLAN 结构中广播,并发送到每个具有网络 VNI 的 VTEP 。

启用 ARP 抑制后,通过 EVPN 学习到的 MAC 地址将传递到 ARP 控制平面。

充当 VTEP 的叶开关通过代理 ARP 应答直接响应 ARP 请求者。

由于 IP 到 MAC 映射已经使用 EVPN 类型 2 消息通过 VXLAN 控制平面进行通信,因此实现 ARP 抑制可以优化覆盖控制平面的更快分辨率。它还减少了结构中的广播流量,因为 ARP 抑制减少了向 VXLAN 基础设施中的每个 VTEP 发送 ARP 请求的需要。

用 EVPN 多归宿替换 MLAG

有时, VXLAN 环境中仍然需要 MLAG 来实现冗余主机连接。 EVPN 多宿是一个摆脱专用 MLAG 解决方案的机会,这些解决方案的扩展范围不超过一个设备冗余级别。

如前所述, VXLAN 有助于消除 MLAG 所需的背靠背叶到脊椎交换机连接的需要。 EVPN multihoming 更进一步,消除了服务器到叶连接中对 MLAG 的任何需要。

Multihoming 使用 EVPN 消息与主机连接进行通信,并使用主机连接信息动态构建与服务器的 L2 邻接。当 MLAG 需要 LAG ID 时,多宿使用以太网段 ID 。接口映射到与同一终端主机的逻辑连接类似的段。

此外,通过在交换机中使用协议标准形式的冗余,转向多主可以提高网络供应商的互操作性。由于多宿使用开放标准协议 BGP ,任何通过 RFC 规范实现多宿的供应商都可以成为以太网段的一部分。

ECMP 和 UCMP 处理流量平衡

ECMP 是大多数第 3 层路由协议中的标准功能,在这些协议中,在所有可用的下一跳上行链路中平衡等成本路由。第 2 层控制平面技术(如生成树)仅允许通过依赖外部技术(如 LACP )实现同等成本平衡。

ECMP 是第 3 层路由中的本机功能,它使您能够提高网络设备的效率。

在某些情况下, ECMP 可能会导致转发效率低下,特别是在执行完整的第 3 层解决方案时,在结构中的任何位置都使用点对点 L3 链路,甚至到主机。在这种情况下,您可能希望在链路数以外的指标上平衡流量。 UCMP 在这里很有用,因为它使用 BGP 标记创建跨跃点的流量分布,以便更好地与应用程序分布相匹配。

通过自适应路由适应交通极化

自适应路由是以太网交换采用的现有 InfiniBand 技术。自适应路由监控链路带宽、链路利用率、交换机缓冲区和 ECN/PFC,以了解特定路径上的流量何时变得拥塞,并从通过较不拥塞的路径动态重新路由中受益。

基于满足这些指标的阈值,交换机可以将流量从一个出口接口重定向到 ECMP 组中的另一个出口接口。这有助于平等地充分利用交换机上的所有链路,而不会造成两极分化的威胁,从而产生低效的流量。

自适应路由的目标是将任何手动调整干预从网络管理员手中解放出来,并让基础结构处理聚合流平衡的优化。

结论

在本文中,我们介绍了数据中心网络中可用的一些概念,这些概念可以通过关注协议栈和数据平面来帮助您优化网络基础设施。这些优化提供了更好的网络虚拟化,有助于减少基础设施上不必要的控制流量,并平衡现有第 1 层链路上的流量,以充分利用所有可用带宽。

关于作者

Rama Darbha 是 NVIDIA 网络组的解决方案架构主管,主要负责数据中心、 NetDevOps 和以太网交换。他热衷于帮助客户和合作伙伴通过开放的网络策略,充分利用他们的人工智能和计算工作负载。 RAMA 有一个活跃的 CCONP 2019 :: 19 和 CCIE × 22804 ,拥有杜克大学工程与管理硕士学位。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    40

    文章

    5419

    浏览量

    171628
  • NVIDIA
    +关注

    关注

    14

    文章

    4981

    浏览量

    103000
  • 数据中心
    +关注

    关注

    16

    文章

    4764

    浏览量

    72101
收藏 人收藏

    评论

    相关推荐

    NIDA发布《智算数据中心网络建设技术要求》

    Alliance,以下简称 “NIDA”)携手中国信息通信研究院等9家组织成员共同发布了《智算数据中心网络建设技术要求》(以下简称 “技术要求”)。该
    的头像 发表于 12-04 11:13 342次阅读

    Meta AI数据中心网络用了哪家的芯片

      在Meta,我们相信开放的硬件会推动创新。在当今世界,越来越多的数据中心基础设施致力于支持新兴的AI技术,开放硬件在协助分解方面发挥着重要作用。通过将传统数据中心
    的头像 发表于 11-25 10:05 351次阅读
    Meta AI<b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>用了哪家的芯片

    诺基亚扩展与微软Azure的数据中心网络供应协议

    的进一步巩固。 作为协议扩展的重要组成部分,诺基亚将向微软Azure提供其最新的7250 IXR-10e平台。该平台以其卓越的性能、灵活性和可扩展性,在数据中心网络中发挥着关键作用。通过提供这一先进平台,诺基亚旨在助力微软Azu
    的头像 发表于 11-22 13:53 180次阅读

    mesh网络技术的优缺点

    、Mesh网络技术的优点 1. 高度的可靠性 Mesh网络的一个显著优点是其高度的可靠性。由于每个节点都与其他多个节点相连,即使某个节点或连接发生故障,数据仍然可以通过其他路径传输,从
    的头像 发表于 11-11 15:13 572次阅读

    简述数据中心网络架构的演变

    随着全球对人工智能(AI)的需求不断增长,数据中心作为AI计算的重要基础设施,其网络架构与连接技术的发展变得尤为关键。
    的头像 发表于 10-22 16:23 286次阅读

    数据中心在5G网络中的演进与发展

    几十年来,数据中心一直位于或靠近网络中心。对于企业、电信运营商、有线电视运营商以及近来的Google和Facebook等服务提供商而言,数据中心是IT的心脏和肌肉。云技术的出现更是彰显
    的头像 发表于 08-16 16:02 407次阅读

    数据中心布线标准有什么

    数据中心布线标准是现代IT基础设施的基石。它们为组织建立可靠和有效的网络提供了指导方针和框架。了解这些标准对于寻求优化数据中心运营和确保无缝连接的组织至关重要。 什么是
    的头像 发表于 06-14 10:51 490次阅读

    HNS 2024:星河AI数据中心网络,赋AI时代新动能

    华为数据通信创新峰会2024在巴库隆重举办,在“星河AI数据中心网络,赋AI时代新动能”主题论坛中,华为面向中东中亚地区发布星河AI数据中心网络
    的头像 发表于 05-15 09:15 651次阅读
    HNS 2024:星河AI<b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>,赋AI时代新动能

    港灯打造了面向未来的下一代电力数据中心网络

    通过华为数据中心网络CloudFabric解决方案实现了秒级切换,保障了“业务零中断”和“零单点故障”,港灯打造了面向未来的下一代电力数据中心网络
    的头像 发表于 04-16 09:29 582次阅读

    华为联合中国信通院发布《华为星河AI数据中心网络测试报告》

    2024 开放数据中心委员会(以下简称ODCC)春季全会在江西婺源顺利召开,全会由ODCC副主席李洁博士主持。全会期间,华为联合中国信通院云大所数据中心团队发布《华为星河AI数据中心网络
    的头像 发表于 04-02 09:25 1463次阅读

    CloudFabric3.0超融合数据中心网络全新升级,携手共筑算力新联接

    在华为中国合作伙伴大会2024期间,华为举办了以“超融合数据中心网络,携手共筑算力新联接”为主题的数据中心网络分论坛。
    的头像 发表于 03-19 09:18 879次阅读

    数据中心加速网络技术优势与实施策略

    数据中心作为新的计算单元,随着网络服务对 CPU 压力的增加,现代工作负载对网络基础设施提出了新的挑战。
    的头像 发表于 03-07 14:37 752次阅读

    是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,针对人工智能(AI)和机器学习(ML)基础设施生态系统,推出了 AI数据中心测试平台,旨在加速AI / ML网络验证和优化的创新。
    的头像 发表于 02-29 09:32 630次阅读
    是德科技推出AI<b class='flag-5'>数据中心</b>测试平台旨在加速AI/ML<b class='flag-5'>网络</b>验证和<b class='flag-5'>优化</b>的创新

    多业务光端机在数据中心的应用:提升网络效率的关键

    随着云计算、大数据技术的迅猛发展,数据中心已成为现代社会不可或缺的基础设施。数据中心内部网络的高效、稳定运行对于整个数据中心的性能至关重要
    的头像 发表于 02-23 14:09 645次阅读

    分布式可视化控制系统助力大数据中心数字化升级!

    维分布式可视化控制系统,该系统以全IP网络架构为基础,利用现代网络技术、计算机技术和音频处理技术通过
    的头像 发表于 12-29 14:59 517次阅读