0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS加速器v21.08的功能应用

星星科技指导员 来源:NVIDIA 作者:Eric Rife 2022-04-20 14:58 次阅读

介绍

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )现已发布。自 NVIDIA GTC 2020 首次发布以来,已经有很长时间了。我们在许多方面都有所改进,特别是在易用性方面, Apache Spark 应用程序的代码更改很少甚至没有。去年,该团队一直专注于添加功能和持续改进性能。为了证明这一点,我们使用 NVIDIA 数据科学( NDS )基准测试了定期测量在 3000 ( 3 TB 未压缩)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我们非常自豪地在提高所有通过查询的端到端速度和降低 NVIDIA EGX 服务器的总体拥有成本方面取得了进展。

基准更新

NVIDIA 决策支持( NDS )是我们对 Apache Spark 社区常用的行业标准数据科学基准的改编。 NDS 包含与行业标准基准测试 TPC-DS 相同的 105 个 SQL 查询,但修改了数据集生成和执行脚本的部分。在 GTC 2021 更新中,有 95 个查询通过。在 21.08 版本中,通过核心外分组方式、窗口排名和密集排名等新功能,我们已经能够在 GPU 上运行所有 105 个查询。

基准设置

比例因子 -3K (带浮点数的 3TB 数据集)

Systems: 4x NVIDIA 认证 EGX 服务器

EGX 服务器硬件规格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件规格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

软件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

图 1 : EGX 服务器上的 NDS 查询速度: GPU vs CPU 。

基于此版本,我们很高兴地向大家展示,所有 105 个查询现在都可以在 GPU 上运行,而无需任何代码更改。

用于这些基准测试的基准服务器对于四台没有 GPU s 的服务器的成本略低于 170000 美元,而在每台服务器中包含一台 NVIDIA A100 GPU 的成本则低于 220000 美元。

简单来说,基准 GPU 服务器的成本是 CPU 服务器的 1.29 倍。

如上图所示(图 1 ),超过 95 个查询现在比 GPU 快 1.29 倍,因此运行起来更便宜。

GPU 上一些速度较慢的查询目前正在解决中,我们正在不懈地努力改进这些查询并提高总体速度。

用户可以很容易地推断出 GPU 的加速从 1x 到 18x 不等,因此建议用户确认 GPU 的正确用例。

如果用户不确定 GPU 的正确用例,鉴定工具将是一个方便的资产。有关鉴定工具的更多信息,请参阅以下章节。

分析和鉴定工具

分析与鉴定工具于 21.06 发布,获得了用户社区的积极反馈以及对新功能的要求。在 21.08 中,鉴定工具现在能够处理 Apache Spark 2.x 版本生成的事件日志。该工具还将支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 运行时生成的事件日志。鉴定工具不再需要 Spark 运行时。用户现在只需在机器上使用 Apache Spark 3.x JAR 即可使用鉴定工具。最新版本还具有选择事件日志的新过滤功能。该工具还查找插件不支持的读取数据格式和类型,并从分数中删除这些格式和类型(基于 SQL Dataframe 操作中的总任务时间)。输出将以简洁的格式报告在终端上,对每个已处理事件日志的详细分析将存储为 csv 输出。

新功能

此版本为数组和结构添加了更多功能。我们现在可以对多层结构数据类型进行联合,也可以以拼花格式编写数组数据类型。我们在现有的超前、滞后和行号功能中添加了秩和密集秩窗口功能。有了这一新增功能, RAPIDS 加速器现在可以支持 SQL 中最常用的窗口运算符。对于时间戳操作符,我们添加了对遗留时间戳的支持。使用此功能,用户可以读取 Spark 2.0 中支持的传统时间戳格式。对于 Databricks 用户,我们添加了在 GPU 中缓存数据的功能(所有其他平台都支持这种功能)。

我们通过处理 GPU 内存溢出的数据集以进行分组和窗口操作,继续改善用户体验。这一改进将节省用户创建分区的时间,以避免 GPU 上出现内存不足错误。类似地, UCX 1.11 的采用改进了 RAPIDS Spark 加速洗牌管理器的错误处理。

关于作者

Eric Rife 是 NVDIA 数据科学公司的技术营销经理。他是一名高级专业人员,拥有 25 年的管理和工程经验,设计和管理全天候关键任务企业系统,包括 Unix / Linux / Windows 服务器、应用程序服务器和多 PB 存储解决方案。他目前领导 NVIDIA 的工作,帮助基础设施经理和数据科学家重新思考如何加快 AI 在企业业务应用中的应用。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9129

    浏览量

    85347
  • WINDOWS
    +关注

    关注

    3

    文章

    3541

    浏览量

    88635
收藏 人收藏

    评论

    相关推荐

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    NVIDIA加速计算引入Polars

    Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据科学家仅在一台机器上就能实现在数秒内处理数亿行数据。
    的头像 发表于 11-20 10:03 197次阅读
    将<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>计算引入Polars

    RAPIDS cuDF将pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 当前已能够为 950 万 pandas 用户带来 GPU 加速,且无需修改代码。
    的头像 发表于 11-20 09:52 165次阅读
    <b class='flag-5'>RAPIDS</b> cuDF将pandas提速近150倍

    AMD Alveo V80计算加速器网络研讨会

    欢迎参加本次网络研讨会,我们将深入探讨 AMD Alveo V80 计算加速器如何帮助您处理高性能计算、数据分析、金融科技、网络安全、存储加速、AI 计算等领域的内存密集型工作负载。Alveo
    的头像 发表于 11-08 09:35 184次阅读

    贸泽开售适用于高性能计算应用的AMD Alveo V80加速器

    2024 年 9 月 25 日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 即日起供应AMD的Alveo™ V80计算加速器卡。该
    发表于 09-27 14:59 173次阅读

    NVIDIA Parabricks v4.3.1版本的新功能

    会(ESHG)上发布,其加入了新的体细胞数据变异检测功能,并将业内领先的工具升级到最新版本。这个版本是继在 NVIDIA GTC 2024 大会上发布 Parabricks v4.3 之后推出的新版本。
    的头像 发表于 09-10 10:22 376次阅读
    <b class='flag-5'>NVIDIA</b> Parabricks <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力、物联网和零售等行业。
    的头像 发表于 09-09 09:57 453次阅读
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平台提升计算性能

    利用边沿速率加速器和自动感应电平转换

    电子发烧友网站提供《利用边沿速率加速器和自动感应电平转换.pdf》资料免费下载
    发表于 09-02 11:58 1次下载
    利用边沿速率<b class='flag-5'>加速器</b>和自动感应电平转换<b class='flag-5'>器</b>

    什么是神经网络加速器?它有哪些特点?

    神经网络加速器是一种专门设计用于提高神经网络计算效率的硬件设备。随着深度学习技术的快速发展和广泛应用,神经网络模型的复杂度和计算量急剧增加,对计算性能的要求也越来越高。传统的通用处理(CPU
    的头像 发表于 07-11 10:40 478次阅读

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的头像 发表于 06-21 11:54 783次阅读

    NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

    根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。
    的头像 发表于 03-04 09:33 1312次阅读
    <b class='flag-5'>NVIDIA</b>将在今年第二季度发布Blackwell架构的新一代GPU<b class='flag-5'>加速器</b>“B100”

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器(AI Accelerator),是一种专为执行机器学习和深度学习任务而设计的ASIC或定制化处理。在智能家居中,AI加速
    的头像 发表于 02-23 00:18 4582次阅读

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是一种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场中的运动。本文将详细介绍回旋加速器的原理以及影响因素。 一、回旋
    的头像 发表于 01-30 10:02 3940次阅读

    回旋加速器中粒子的最大动能与什么有关

    回旋加速器是一种用于加速粒子的装置,通过不断变化的磁场和电场来不断加速粒子,使其达到极高的速度和能量。粒子的最大动能取决于几个关键因素。 首先,回旋加速器的设计和性能对粒子的最大动能有
    的头像 发表于 01-18 10:42 3160次阅读

    Wakefield激光加速器 - 能量里程碑

    由The University of Texas at Austin物理学副教授比约恩·“曼努埃尔”·赫格利希(Bjorn “Manuel” Hegelich)领导的国际研究小组最近展示了一种长度不到20米的小型粒子加速器,该加速器产生的电子束能量为100亿电子伏特(10
    的头像 发表于 01-14 09:38 1048次阅读
    Wakefield激光<b class='flag-5'>加速器</b> - 能量里程碑