0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS加速器可将工作分配集群中各节点

科技绿洲 来源:NVIDIA 作者:NVIDIA 2022-04-01 14:15 次阅读

借助适用于 Apache Spark 的 NVIDIA RAPIDS 加速器,团队能够更快处理数万亿条记录,在降低成本的同时优化网络并提高客户满意度。

AT&T 通过无线网络连接了从阿留申群岛到佛罗里达礁岛群的 1 亿多名用户,催生出一片大数据海洋。

Abhay Dabholkar 管理着一个研究小组,他们如同闪耀的灯塔,在数据海洋中寻找最佳导航工具。

作为在 AT&T 工作十余年的杰出 AI 架构师,Dabholkar 表示:“我们可以使用新工具来改变在 AT&T 的日常工作,这一过程十分有趣,并且当我们为员工提供最新的核心工具时,他们会对自己的工作感到更满意。”

近期,该团队在 GPU 助力的服务器上测试了适用于 Apache Spark 的 NVIDIA RAPIDS 加速器,该软件可将工作分配到集群中的各节点。

在本次测试中,仅 5 小时便处理完一个月的移动数据 - 2.8 万亿行信息。相较于先前的测试,速度提升 3.3 倍,而成本则降低 60%。

惊叹时刻

Dabholkar 表示:“这真是令人惊叹,因为在 CPU 集群上,仅处理 7 天的数据我们就需要耗费超过 48 小时的时间。过去尽管我们拥有数据,但却无法充分利用,因为处理这些数据需要很长时间。”

具体而言,该测试对所谓的 ETL(即提取、转换和加载流程)进行了基准测试,以便筛选出无用数据,然后再用筛选后的数据训练 AI 模型,发现全新见解。

他还表示:“目前我们认为 GPU 可用于 ETL 以及我们在 Spark 中执行的所有批处理工作负载,因此我们正在探索其他 RAPIDS 库,将工作从特征工程扩展到 ETL 和机器学习。”

目前 AT&T 在 CPU 服务器上运行 ETL,然后将数据转移至 GPU 服务器进行训练。他补充道,在单个 GPU 工作流中完成所有工作可以节省时间和成本。

提高客户满意度,加速网络设计

时间和成本的节省在众多用例中都有所体现。

例如,用户可以更快获取最佳连接,从而提高客户满意度并减少客户流失率。Dabholkar 表示:“我们还能更快确定 5G 信号塔和天线参数。”

负责监督 RAPIDS 测试的团队高级成员 Chris Vo 表示,要确定在哪些 AT&T 光纤覆盖区域推出支持卡车,需要进行耗时的地理空间计算,而 RAPIDS 和 GPU 可以加速这一过程。

Dabholkar 说:“这项技术给我们带来极大影响,我们每天可能会收到 300-400TB 的新数据,先前需要耗费两三周以上的时间制作报告,而现在只需几小时便可完成。”

三个用例和统计结果

研究人员正在与 AT&T 数据平台团队成员分享他们的研究成果。

他说:“如果作业时间过长,且您拥有大量数据,我们建议您开启 GPU ,并借助 Spark,让在 CPU 上运行的代码也可以在 GPU 上运行。”

目前为止,各个团队在三个不同的用例中各有收获;其他团队也计划着测试其工作负载。

Dabholkar 乐观地表示,业务部门会将其测试结果引入生产系统中。

他说:“我们是一家拥有各类数据集的电信公司,每天都需要处理 PB 级数的数据,这种方法可以大大节省我们的时间和成本。”

此外,包括美国国家税务局在内的其他企业用户也纷纷选择使用这项技术。现有超过 13000 家公司(包括 400 家《财富》500 强公司)使用 Apache Spark,这表明大多数公司都愿意选择这种方式。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    799

    浏览量

    37844
  • NVIDIA
    +关注

    关注

    14

    文章

    4981

    浏览量

    102999
  • 无线网络
    +关注

    关注

    6

    文章

    1434

    浏览量

    65929
收藏 人收藏

    评论

    相关推荐

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    NVIDIA加速计算引入Polars

    Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据科学家仅在一
    的头像 发表于 11-20 10:03 197次阅读
    将<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>计算引入Polars

    RAPIDS cuDF将pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 当前已能够为 950 万 pandas 用户带来 GPU 加速,且无需修改代码。
    的头像 发表于 11-20 09:52 165次阅读
    <b class='flag-5'>RAPIDS</b> cuDF将pandas提速近150倍

    磁调制式电流传感在粒子加速器的应用

    粒子加速器是一种利用电磁场加速带电粒子(如质子、电子、离子等)至极高速度的装置。其工作原理基于洛伦兹力定律,即当带电粒子在电磁场运动时,会受到垂直于其速度方向的力作用,从而改变其运动
    的头像 发表于 11-14 11:43 180次阅读

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力、物联网和零售等行业。
    的头像 发表于 09-09 09:57 453次阅读
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平台提升计算性能

    适用于数据中心应用的硬件加速器的直流/直流转换解决方案

    电子发烧友网站提供《适用于数据中心应用的硬件加速器的直流/直流转换解决方案.pdf》资料免费下载
    发表于 08-26 09:38 0次下载
    适用于数据中心应用<b class='flag-5'>中</b>的硬件<b class='flag-5'>加速器</b>的直流/直流转换<b class='flag-5'>器</b>解决方案

    BUCK电路各节点电压怎么计算

    BUCK电路是一种常见的直流-直流转换,广泛应用于电源管理领域。在BUCK电路,输入电压被转换为较低的输出电压,同时保持较高的效率。本文将介绍BUCK电路的工作原理、各节点电压的计
    的头像 发表于 07-12 09:25 1243次阅读

    基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

    我们更好的进行对 SNN 工作负载的分析和加速 效果的类比。 (3)无论是欧盟大规模的类脑计算平台 SpiNNaker,还是软件仿真 NEST、NEURON 等 都支持多节点
    发表于 06-25 18:35

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的头像 发表于 06-21 11:54 783次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群 Grace Blackwell 超级芯片的数量扩展至数
    发表于 03-19 10:56 422次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

    根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。
    的头像 发表于 03-04 09:33 1312次阅读
    <b class='flag-5'>NVIDIA</b>将在今年第二季度发布Blackwell架构的新一代GPU<b class='flag-5'>加速器</b>“B100”

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器(AI Accelerator),是一种专为执行机器学习和深度学习任务而设计的ASIC或定制化处理。在智能家居中,AI加速
    的头像 发表于 02-23 00:18 4582次阅读

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是一种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场的运动。本文将详细介绍回旋
    的头像 发表于 01-30 10:02 3940次阅读

    回旋加速器粒子的最大动能与什么有关

    回旋加速器是一种用于加速粒子的装置,通过不断变化的磁场和电场来不断加速粒子,使其达到极高的速度和能量。粒子的最大动能取决于几个关键因素。 首先,回旋加速器的设计和性能对粒子的最大动能有
    的头像 发表于 01-18 10:42 3160次阅读

    Wakefield激光加速器 - 能量里程碑

    由The University of Texas at Austin物理学副教授比约恩·“曼努埃尔”·赫格利希(Bjorn “Manuel” Hegelich)领导的国际研究小组最近展示了一种长度不到20米的小型粒子加速器,该加速器产生的电子束能量为100亿电子伏特(10
    的头像 发表于 01-14 09:38 1048次阅读
    Wakefield激光<b class='flag-5'>加速器</b> - 能量里程碑