0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NetQ自动化网络监控减少停机时间

星星科技指导员 来源:NVIDIA 作者:Ranga Maddipudi 2022-06-21 14:58 次阅读

NVIDIA NetQ 是一种高度可扩展的现代网络操作工具,为 NVIDIA Spectrum Ethernet 平台提供可操作的可见性。它将高级遥测技术与用户界面相结合,使网络工作流程更易于故障排除和自动化,同时减少维护和停机时间。

我们最近发布了 NetQ 4.2.0 ,其中包括:

简化的事件管理

增强的流量遥测分析

新 RoCE 验证

新增 DPU 监控

简化的事件管理

通过 NetQ 4.2 ,我们简化了通过接口传递网络事件的方式。事件的严重性各不相同。一些事件是网络警报,可能需要进一步调查,而其他事件是信息性通知,可能不需要干预。在此版本之前, NetQ 将报警和信息事件显示为两个单独的卡。 NetQ 4.2 版本将两个卡合并为一个卡,扩展后,该卡将显示一个仪表板,以帮助您快速可视化所有网络事件。

图 1 :。 NetQ 事件仪表板

仪表板显示事件的时间线,以及导致大多数事件的开关。您可以按类型筛选事件,包括接口、网络服务、系统和阈值交叉事件。

承认事件有助于你关注需要你关注的活动事件。从仪表板中,还可以创建规则以抑制事件。此功能还可帮助您关注活动事件,从而使已知问题或错误警报的显示方式与错误显示方式不同。

增强的流量遥测分析

NetQ 4.1.0 为 Cumulus Linux 5 引入了 结构范围内的网络延迟和缓冲区占用分析 。 x 数据中心结构。现在, NetQ 4.2 支持混合结构(使用 Cumulus Linux 5 )中的部分路径流遥测分析。 x 交换机与其他交换机(包括非 Cumulus Linux 5.x 和第三方交换机)结合使用。 Cumulus Linux 5 。路径中的 x 设备显示流统计信息,例如延迟和缓冲区占用率。不受支持的设备在流量分析中表示为带红色 X 的黑条,并且设备不显示流量统计信息。

图 2 :。 NetQ 流量遥测分析结果

此外, NetQ 4.2 流量遥测分析显示了所分析流量的上下文“刚刚发生的事情”( WJH )事件和下降。带有 WJH 事件的交换机在流分析图中表示为红色条纹条。将鼠标悬停在带有红色条的设备上,会显示 WJH 事件摘要。

图 3 :。利用 WJH 数据进行 NetQ 流量遥测分析

新 RoCE 验证

通过聚合以太网使用 RDMA ( RoCE ),您可以通过以太网使用远程直接内存访问( RDMA )而不是使用主机 CPU 来写入计算或存储元素。 NetQ 4.0.0 引入了 RoCE 配置和计数器,包括设置各种 RoCE 阈值交叉警报( TCA )的能力。

使用 NetQ 4.2.0 , RoCE 验证检查:

交换机间有损或无损模式配置的一致性

DSCP 、服务池、端口组和流量类设置的一致性

ECN 阈值设置的一致性

无损模式 PFC 配置的一致性

增强型变速箱选择设置的一致性

您可以安排 RoCE 验证定期或按需运行。

新增 DPU 监控

NVIDIA BlueField 数据处理器 ( DPU )通过卸载、加速和隔离广泛的高级网络、存储和安全服务,为任何工作负载提供安全、加速的基础架构。

NetQ 帮助您监控网络上的 DPU 库存。您可以监视 DPU 操作系统ASIC 、 CPU 型号、磁盘和内存信息,以帮助管理升级、法规遵从性和其他规划任务。 使用 NetQ ,您可以查看和监视键 DPU 属性,包括已安装的软件包以及 CPU 、磁盘和内存利用率。

图 4 :。 NetQ- DPU 利用率详细信息

在本文中,您已经看到了 NetQ 4.2.0 提供的一些新功能的概述。

关于作者

Ranga Maddipudi 是 NVIDIA 网络组的产品管理总监,负责网络遥测和 NetQ 。他在网络控制器、自动化和分析方面有丰富的经验。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    16154

    浏览量

    177270
  • NVIDIA
    +关注

    关注

    14

    文章

    4863

    浏览量

    102755
  • 交换机
    +关注

    关注

    20

    文章

    2615

    浏览量

    99180
收藏 人收藏

    评论

    相关推荐

    利用智能eFuses最大限度地缩短系统停机时间

    电子发烧友网站提供《利用智能eFuses最大限度地缩短系统停机时间.pdf》资料免费下载
    发表于 09-25 10:25 0次下载
    利用智能eFuses最大限度地缩短系统<b class='flag-5'>停机时间</b>

    开关电源自动化测试设备:如何实现自动化测试?

    开关电源自动化测试设备是将测试软件和测试硬件集成在一个电源测试柜中的ate自动测试设备,其测试原理是通过计算机操控测试仪器,从而减少人工干预,完成开关电源的自动化测试,旨在解放人力,提
    的头像 发表于 08-30 18:19 1142次阅读
    开关电源<b class='flag-5'>自动化</b>测试设备:如何实现<b class='flag-5'>自动化</b>测试?

    变电站综合自动化监控系统,实现电力系统自动化和变电站无人值守

    Acrel-1000变电站综合自动化监控系统,是我司根据电力系统自动化及无人值守的要求,总结国内外的研究和生产的先进经验,专门研制出的新一代电力监控系统。本系统具有保护、遥测、遥信、遥
    的头像 发表于 08-20 15:52 2471次阅读
    变电站综合<b class='flag-5'>自动化</b><b class='flag-5'>监控</b>系统,实现电力系统<b class='flag-5'>自动化</b>和变电站无人值守

    机械自动化和电气自动化区别是什么

    机械自动化和电气自动化是现代工业生产中两个重要的领域,它们在许多方面有着密切的联系,但也存在一些明显的区别。 一、基本概念 机械自动化 机械自动化是指利用机械设备、传感器、控制系统等技
    的头像 发表于 07-01 09:33 3601次阅读

    机械自动化自动化的一种吗

    引言 自动化技术是指利用控制装置对生产过程进行控制,以实现生产过程的自动化。机械自动化自动化技术的一种,它主要涉及到使用机械设备和控制系统来实现生产过程的
    的头像 发表于 07-01 09:32 1516次阅读

    罗克韦尔自动化旗下Fiix发布GenAI规范性工单

    作为工业自动化、信息和数字转型领域的全球领先企业之一,罗克韦尔自动化宣布将生成式人工智能 (GenAI) 规范性工单添加至 Fiix 资产风险预测器软件中,进而打造出旗下首款可完整
    的头像 发表于 06-28 09:20 409次阅读

    机械制造与自动化自动化类吗

    机械制造与自动化自动化领域的一个重要分支,它涉及到机械设计、制造、检测、控制等多个方面,是现代制造业的核心组成部分。 机械制造与自动化是指利用计算机、机器人、传感器等自动化设备和技术
    的头像 发表于 06-11 11:18 1412次阅读

    工业自动化自动化区别是什么

    生产过程的自动控制和管理。自动化的目标是提高生产效率、降低成本、减少人为错误和提高产品质量。自动化技术广泛应用于各个领域,包括制造业、交通运输、医疗保健、家庭生活等。 二、工业
    的头像 发表于 06-11 11:13 1521次阅读

    智能升级:PROFINET网络结合TSN技术将引领工业自动化新潮流

    PROFINET与TSN技术的结合无疑将为工业自动化注入新的活力。这种技术的融合不仅可提升工业自动化系统的网络通信性能,还可满足高精度时间同步和实时数据传输的迫切需求。随着5G、物联网
    的头像 发表于 05-21 17:22 412次阅读
    智能<b class='flag-5'>化</b>升级:PROFINET<b class='flag-5'>网络</b>结合TSN技术将引领工业<b class='flag-5'>自动化</b>新潮流

    挖掘未来:私有LTE/5G网络驱动智慧矿山的自动化

    私有LTE/5G网络为世界上一些最偏远的角落提供无线连接。如果没有无线通信网络,各行业就无法满足增加产量、降低运营成本和减少环境破坏的需求。 在本案例研究中,我们着眼于自动化如何改变无
    的头像 发表于 04-08 17:04 421次阅读
    挖掘未来:私有LTE/5G<b class='flag-5'>网络</b>驱动智慧矿山的<b class='flag-5'>自动化</b>

    NVIDIA融合数字孪生与实时AI,革新工业自动化

    NVIDIA引领工业自动化新潮流,通过结合数字孪生与实时AI技术,推动行业迈向新的发展阶段。NVIDIA软件套件——Omniverse、Metropolis、Isaac和cuOpt,共同构建了一个独特的AI Gym,为机器人和A
    的头像 发表于 03-27 10:44 446次阅读

    分布式IO工业自动化数据采集与分析的核心

    随着工业自动化技术的不断发展,分布式IO在工业自动化领域的应用越来越广泛。作为一种先进的控制技术,分布式IO能够实现设备的分布式控制和监测,提高生产效率、降低能耗和减少故障率。 分布式IO可以提高
    发表于 12-28 14:47

    借助 NVIDIA NVUE 和 Ansible 实现数据中心网络自动化

    旨在通过提供全面的模块和角色列表来简化您的网络自动化之旅,使您能够在自己的环境中轻松地开始使用参考拓扑。 NVIDIA User Experience(NVUE) NVIDIA Us
    的头像 发表于 12-20 19:35 479次阅读
    借助 <b class='flag-5'>NVIDIA</b> NVUE 和 Ansible 实现数据中心<b class='flag-5'>网络</b><b class='flag-5'>自动化</b>

    LabVIEW与Tektronix示波器实现电源测试自动化

    稳定性测试、峰值检测等,并自动生成详细的测试报告,包括波形图、统计数据和分析结论。这种自动化不仅大大减少了测试时间,也减少了人为错误,提高了
    发表于 12-09 20:37

    自动化设备如何快速实现远程监控

    随着物联网技术的普及,越来越多的设备通过传感器和网络连接实现远程监控自动化物联网远程监控方案旨在通过实时监测、分析和控制,提高设备的运行效率和安全性,降低人工成本。然而,如果这些物品
    的头像 发表于 12-01 15:08 822次阅读