0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-03 10:04 次阅读

NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心

Gal Dalal 希望为居家办公或在办公室工作的人缓解网络压力。

这位 NVIDIA 高级研究科学家是以色列一所 10 人实验室的成员,他正在使用 AI 减少计算机网络的拥堵。

对于笔记本电脑用户来说,如果看到屏幕上出现不停转动的圈圈,甚至无法移动光标,那就像在高速路上遇到一片红海那样糟糕。如同在交通高峰期,大批旅客想要快速到达某地,他们在途中互相拥挤,有时还会发生碰撞。

站在交叉路口的 AI

网络使用拥塞控制来管理数字通信业务量。拥塞控制本质上是嵌入到网络适配器和交换机中的规则,但随着网络上用户数量的增加,用户之间的冲突可能变得过于复杂而难以预测。

AI 可以发现模式的发展过程并作出响应,因此有望成为更好的“交警”。这就是为什么 Dalal 与世界各地的许多研究人员一起寻找通过强化学习使网络变得更加智能的方法。强化学习是当模型找到好的解决方案时,会对它们进行奖励的 AI。

但直到现在,出于种种原因,还没有人能够想出实用的方法。

与时间赛跑

网络需要既高效又公平,这样才不会有忽略任何请求。这种平衡很难达成,因为在数字“道路”上,没有任何“司机”可以看到其他“司机”不断变化的轨迹和预定目的地。

这也是与时间赛跑的比赛。为了发挥作用,网络需要在大约一微秒(即百万分之一秒)的时间内对情况做出反应。

为了使网络交通变得顺畅,NVIDIA 团队受到先进计算机游戏 AI 的启发,创造了新的强化学习技术并将其应用于网络问题。

NVIDIA 在 2021 年的论文中描述了他们的突破性进展,包括提出使用算法和相应的奖励函数来创造平衡的网络,单个网络流可用的本地信息是此网络的唯一基础。凭借该算法,团队在其 NVIDIA DGX 系统上创建、训练并运行了 AI 模型。

效果惊人

Dalal 回忆道,在那次会议上,来自 NVIDIA 的 Chen Tessler 用图表展示了该模型在模拟的 InfiniBand 数据中心网络上的运行结果。

Dalal 表示:“我们当时觉得效果十分显著。”他曾在以色列著名的技术大学,以色列理工学院(Technion)写过关于强化学习的博士论文。

他还认为:“特别惊喜的在于我们只在 32 个网络流上训练模型,它很好地概括了所学,以管理 8000 多个包含各种复杂情况的网络流,因此这个机器比预先制定的规则更有效。”

在 NVIDIA 的测试中,强化学习(紫色)的表现优于所有基于规则的拥塞控制算法

事实上,与最好的基于规则的技术相比,该算法的吞吐量至少提高了 1.5 倍,延迟降低了 4 倍。

自该论文发布以来,这项工作由于展现了强化学习在现实世界中的应用潜力而赢得了赞誉。

在网络中处理 AI

下一个重要的步骤仍然是正在进行中的工作——设计 AI 模型版本,它可以使用网络中有限的算力和内存资源以微秒级速度运行。Dalal 描绘了两个前进方向。

Dalal 的团队正在与设计 NVIDIA BlueField DPU 的工程师一起优化用于未来硬件的 AI 模型。BlueField DPU 的目标是在网络内运行不断扩展的通信作业,从负担过重的 CPU 上卸载任务。

另外, Dalal 的团队正在将 AI 模型的精髓提炼成名为提升树的机器学习技术。提升树由一系列“是”与“否”的决策组成,它同样十分智能,但运行起来更简单。该团队的目标是在今年晚些时候以能够立即用来缓解网络流量的形式展示其工作。

及时的“交通”解决方案

目前,Dalal 已经将强化学习应用于从自动驾驶汽车到数据中心冷却和芯片设计等各个领域。当 NVIDIA 于 2020 年 4 月 NVIDIA 收购 Mellanox 时,这位 NVIDIA 以色列研究员开始与附近网络组的新同事进行合作。

Dalal 表示:“将 AI 算法应用于 NVIDIA 拥堵控制团队的工作十分有意义。两年后的今天,这项研究变得更加成熟了。”

而时机也已经成熟。最近的报道显示,从疫情爆发前到现在,以色列路上的汽车数量出现了两位数增长,这可能会鼓励更多的人在家办公,网络会变得更加拥堵。

幸运的是,AI “交警”正在赶赴岗位。

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5160

    浏览量

    104944
  • 数据中心
    +关注

    关注

    16

    文章

    5012

    浏览量

    72815
  • AI
    AI
    +关注

    关注

    87

    文章

    32968

    浏览量

    272694

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    台式超级计算机NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机
    的头像 发表于 03-20 18:59 587次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机
    发表于 03-19 09:59 184次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 个人 <b class='flag-5'>AI</b> <b class='flag-5'>计算机</b>

    计算机网络架构的演进

    计算机网络架构的演进见证了信息技术的飞速发展。早期的总线型网络架构,通过一条共享的通信线路连接各个节点,结构简单且成本较低,但存在单点故障和传输效率不高的问题。随着技术的发展,星型网络架构逐渐
    的头像 发表于 01-21 11:11 243次阅读

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究
    的头像 发表于 01-08 11:03 566次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    计算机,具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小,能够为商业 AI 开发者、科技爱好者和学生等各类
    发表于 12-18 17:01 572次阅读
    <b class='flag-5'>NVIDIA</b> 推出高性价比的生成式 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算机</b>

    NVIDIA与谷歌量子AI部门达成合作

    NVIDIA CUDA-Q 平台使谷歌量子 AI 研究人员能够为其量子计算机创建大规模的数字模型
    的头像 发表于 11-20 09:39 448次阅读

    NVIDIA助力xAI打造全球最大AI超级计算机

    NVIDIA 宣布,xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了NVIDIA Spe
    的头像 发表于 10-30 11:38 590次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    、超大规模的 AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus 是世界上最大的 AI 超级计算机,目前正被
    发表于 10-30 09:33 232次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算机</b>

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 669次阅读

    应用于计算机网络服务器晶振SG3225HBN(X1G005141000500)

    计算机网络服务器中,稳定和高性能的时钟源对于数据处理和网络通信的准确性至关重要,SG3225HBN晶振(型号X1G005141000500)凭借其高频率稳定性、低相位噪声、高抗干扰能力以及
    发表于 09-05 10:05 0次下载

    计算机网络中常见的默认端口号及其用途

    网络工程领域,了解和掌握默认端口号是至关重要的。端口号是计算机网络中最基本的概念之一,用于标识特定的网络服务或应用程序。本文将详细介绍常见的默认端口号及其用途,帮助网络工程师更好地理
    的头像 发表于 08-13 16:33 1994次阅读

    计算机网络中的三种通信方式

    计算机网络中的三种通信方式,即单工通信、半双工通信和全双工通信,是理解和设计高效网络架构的基础。每种通信方式都有其独特的特性、应用场景及优缺点。以下是对这三种通信方式的详细分析,旨在提供深入的理解。
    的头像 发表于 08-07 15:00 4096次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 685次阅读

    计算机视觉技术的AI算法模型

    计算机视觉技术作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像及视频中的信息。为了实现这一目标,计算机视觉技术依赖于多种先进的AI算法
    的头像 发表于 07-24 12:46 1316次阅读

    NVIDIA和Recursion利用AI超级计算机加快新药研发

    BioHive 由 NVIDIA AI 驱动,用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中,它的排名上升了 100 多位。
    的头像 发表于 05-16 09:46 1443次阅读
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b>超级<b class='flag-5'>计算机</b>加快新药研发