0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-03 10:04 次阅读

NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心

Gal Dalal 希望为居家办公或在办公室工作的人缓解网络压力。

这位 NVIDIA 高级研究科学家是以色列一所 10 人实验室的成员,他正在使用 AI 减少计算机网络的拥堵。

对于笔记本电脑用户来说,如果看到屏幕上出现不停转动的圈圈,甚至无法移动光标,那就像在高速路上遇到一片红海那样糟糕。如同在交通高峰期,大批旅客想要快速到达某地,他们在途中互相拥挤,有时还会发生碰撞。

站在交叉路口的 AI

网络使用拥塞控制来管理数字通信业务量。拥塞控制本质上是嵌入到网络适配器和交换机中的规则,但随着网络上用户数量的增加,用户之间的冲突可能变得过于复杂而难以预测。

AI 可以发现模式的发展过程并作出响应,因此有望成为更好的“交警”。这就是为什么 Dalal 与世界各地的许多研究人员一起寻找通过强化学习使网络变得更加智能的方法。强化学习是当模型找到好的解决方案时,会对它们进行奖励的 AI。

但直到现在,出于种种原因,还没有人能够想出实用的方法。

与时间赛跑

网络需要既高效又公平,这样才不会有忽略任何请求。这种平衡很难达成,因为在数字“道路”上,没有任何“司机”可以看到其他“司机”不断变化的轨迹和预定目的地。

这也是与时间赛跑的比赛。为了发挥作用,网络需要在大约一微秒(即百万分之一秒)的时间内对情况做出反应。

为了使网络交通变得顺畅,NVIDIA 团队受到先进计算机游戏 AI 的启发,创造了新的强化学习技术并将其应用于网络问题。

NVIDIA 在 2021 年的论文中描述了他们的突破性进展,包括提出使用算法和相应的奖励函数来创造平衡的网络,单个网络流可用的本地信息是此网络的唯一基础。凭借该算法,团队在其 NVIDIA DGX 系统上创建、训练并运行了 AI 模型。

效果惊人

Dalal 回忆道,在那次会议上,来自 NVIDIA 的 Chen Tessler 用图表展示了该模型在模拟的 InfiniBand 数据中心网络上的运行结果。

Dalal 表示:“我们当时觉得效果十分显著。”他曾在以色列著名的技术大学,以色列理工学院(Technion)写过关于强化学习的博士论文。

他还认为:“特别惊喜的在于我们只在 32 个网络流上训练模型,它很好地概括了所学,以管理 8000 多个包含各种复杂情况的网络流,因此这个机器比预先制定的规则更有效。”

在 NVIDIA 的测试中,强化学习(紫色)的表现优于所有基于规则的拥塞控制算法

事实上,与最好的基于规则的技术相比,该算法的吞吐量至少提高了 1.5 倍,延迟降低了 4 倍。

自该论文发布以来,这项工作由于展现了强化学习在现实世界中的应用潜力而赢得了赞誉。

在网络中处理 AI

下一个重要的步骤仍然是正在进行中的工作——设计 AI 模型版本,它可以使用网络中有限的算力和内存资源以微秒级速度运行。Dalal 描绘了两个前进方向。

Dalal 的团队正在与设计 NVIDIA BlueField DPU 的工程师一起优化用于未来硬件的 AI 模型。BlueField DPU 的目标是在网络内运行不断扩展的通信作业,从负担过重的 CPU 上卸载任务。

另外, Dalal 的团队正在将 AI 模型的精髓提炼成名为提升树的机器学习技术。提升树由一系列“是”与“否”的决策组成,它同样十分智能,但运行起来更简单。该团队的目标是在今年晚些时候以能够立即用来缓解网络流量的形式展示其工作。

及时的“交通”解决方案

目前,Dalal 已经将强化学习应用于从自动驾驶汽车到数据中心冷却和芯片设计等各个领域。当 NVIDIA 于 2020 年 4 月 NVIDIA 收购 Mellanox 时,这位 NVIDIA 以色列研究员开始与附近网络组的新同事进行合作。

Dalal 表示:“将 AI 算法应用于 NVIDIA 拥堵控制团队的工作十分有意义。两年后的今天,这项研究变得更加成熟了。”

而时机也已经成熟。最近的报道显示,从疫情爆发前到现在,以色列路上的汽车数量出现了两位数增长,这可能会鼓励更多的人在家办公,网络会变得更加拥堵。

幸运的是,AI “交警”正在赶赴岗位。

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4838

    浏览量

    102683
  • 数据中心
    +关注

    关注

    16

    文章

    4613

    浏览量

    71866
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267905

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    、超大规模的 AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus 是世界上最大的 AI 超级计算机,目前正被
    发表于 10-30 09:33 79次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算机</b>

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 300次阅读

    应用于计算机网络服务器晶振SG3225HBN(X1G005141000500)

    计算机网络服务器中,稳定和高性能的时钟源对于数据处理和网络通信的准确性至关重要,SG3225HBN晶振(型号X1G005141000500)凭借其高频率稳定性、低相位噪声、高抗干扰能力以及
    发表于 09-05 10:05 0次下载

    计算机网络中常见的默认端口号及其用途

    网络工程领域,了解和掌握默认端口号是至关重要的。端口号是计算机网络中最基本的概念之一,用于标识特定的网络服务或应用程序。本文将详细介绍常见的默认端口号及其用途,帮助网络工程师更好地理
    的头像 发表于 08-13 16:33 981次阅读

    计算机网络中的三种通信方式

    计算机网络中的三种通信方式,即单工通信、半双工通信和全双工通信,是理解和设计高效网络架构的基础。每种通信方式都有其独特的特性、应用场景及优缺点。以下是对这三种通信方式的详细分析,旨在提供深入的理解。
    的头像 发表于 08-07 15:00 1661次阅读

    计算机视觉技术的AI算法模型

    计算机视觉技术作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像及视频中的信息。为了实现这一目标,计算机视觉技术依赖于多种先进的AI算法
    的头像 发表于 07-24 12:46 524次阅读

    NVIDIA BioNeMo全新基础模型拓展对计算机辅助药物研发的支持

    Cadence、Iambic Therapeutics 等 100 多家公司采用 NVIDIA AI 来推动计算机辅助药物研发和生成式 AI 的发展。
    的头像 发表于 03-25 11:01 427次阅读

    什么是计算机网络的拓扑结构?主要的拓扑结构有哪些?

    计算机网络的拓扑结构是指计算机网络中各个节点(包括计算机、服务器、路由器等)之间连接的方式和形式。拓扑结构可以影响到网络的性能、可靠性和扩展
    的头像 发表于 01-31 10:40 1714次阅读

    计算机网络路由器和交换机的区别

    计算机网络中,路由器和交换机是两种常用的网络设备,它们在网络中起着重要的作用。虽然它们的功能有一些重叠,但也存在一些关键的区别。本文将详细介绍计算机网络中路由器和交换机的区别,包括它们
    的头像 发表于 01-14 11:28 928次阅读

    电话交换机和计算机网络交换机的区别是什么呢?

    电话交换机和计算机网络交换机的区别是什么呢? 电话交换机和计算机网络交换机是两种不同的设备,它们在功能、应用和工作原理等方面存在着许多区别。 一、功能区别: 电话交换机主要用于传输和交换电话
    的头像 发表于 01-09 11:29 1263次阅读

    东莞计算机网络工程包括哪些?

    计算机网络工程是指设计、建立和管理计算机与设备之间的连接和通信系统的过程。网络工程包括哪些内容呢?广东东莞网络工程公司表示它涵盖了网络规划、
    的头像 发表于 12-27 17:47 632次阅读

    计算机网络中的通信子网主要有哪些功能?

    计算机网络中的通信子网主要负责数据的传输、处理、转换和交换,以及提供相关的网络控制协议、通信控制软件和通信设备等功能,同时还对网络进行管理和为用户提供数据传输接口。它是计算机网络的核心
    的头像 发表于 12-15 17:27 1448次阅读

    通信子网在计算机网络中的地位和作用

    通信子网在计算机网络中扮演着至关重要的角色。它是实现网络内和网络间数据通信的关键基础设施,为上层应用提供了通用的通信接口和协议。同时,它也是促进信息交流和知识共享的重要平台。未来,随着技术的不断进步和应用需求的不断变化,通信子网
    的头像 发表于 12-15 17:15 699次阅读

    计算机网络中的通信子网:架构、协议与技术简介

    计算机网络中,通信子网是负责实现主机之间以及主机与终端之间数据传输的核心部分。它由一系列硬件设备和通信协议组成,为上层应用提供可靠、高效和透明的数据传输服务。本文将详细介绍通信子网的架构、协议
    的头像 发表于 12-07 17:42 993次阅读

    计算机网络中速率和带宽的区别

    bps。也就是说单位时间内线路中允许通过的比特的最大值。 两者的区别: 参考了韩立刚老师计算机网络的课程以及CSDN的计算机网络中速率(date rate)和带宽的区别,给出自己的理解: 可以将数字信道
    发表于 11-27 16:29