0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将NVIDIA加速计算引入Polars

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-11-20 10:03 次阅读

Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据科学家仅在一台机器上就能实现在数秒内处理数亿行数据。

日新月异的数据挑战

Pandas 等传统数据处理库均为单线程,当处理数据超过数百万行时就会显得“力不从心”。分布式数据处理系统虽然可以处理数十亿行数据,但又会增加处理中小型数据集的复杂程度和经费开支。

在高效处理数千万至数亿行数据的工具之间一直存在着差距。这类工作负载常见于金融、零售、制造等行业的模型开发、需求预测和物流中。

在面向数据科学家和工程师Python 库中,Polars 的增长速度位居前列,其设计初衷就是为了应对这些挑战。该程序库使用了先进的查询优化技术,以减少不必要的数据移动和处理,使数据科学家可以仅用一台机器就能流畅地处理数亿行规模的工作负载。Polars 弥补了单线程解决方案速度过慢和分布式系统会增加非必要复杂性的缺陷,提供了一个极具吸引力的“中等规模”数据处理解决方案。

将 NVIDIA 加速计算引入 Polars

与其他仅使用 CPU 的数据处理工具相比,Polars 利用多线程执行、高级内存优化和惰性求值(lazy evaluation)功能,可显著提升开箱即用的加速性能。

但由于各行各业的企业面临日益增长的数据处理需求,例如需要分析数十亿笔金融交易、管理复杂的库存系统等,都需要更加强大的性能。这时就该轮到加速计算发挥作用了:

cuDF 是 NVIDIA CUDA-X 加速库中的 RAPIDS 套件的一部分,它是一个由 GPU 提供加速的 DataFrame 程序库,能够利用 GPU 的大规模并行处理能力显著提高数据处理性能。

Polars 团队与 NVIDIA 一起将 cuDF 的速度与 Polars 的效率相结合,使性能最高提速至在 CPU 上 Polars 的 13 倍。如此,即便用户的数据处理工作量增长到数亿甚至数十亿行数据,依然能够保持交互。

9f9cb96c-a016-11ef-93f3-92fbcf53809c.jpg

图 1.图中所示的是 PDS-H 基准测试 22 个查询中加速幅度最大的 4 个查询。在运行包含众多复杂分组和连接操作的查询时,RAPIDS cuDF 驱动的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基准测试规模系数 80 | GPU:NVIDIA H100 | CPU:英特尔 Xeon W9-3495X(Sapphire Rapids) | 存储:本地NVMe。备注:PDS-H 源自 TPC-H,但这些结果与 TPC-H 的结果不具有可比性。

由于 Polars GPU 引擎直接内置在 Polars Lazy API 中,用户只需通过 pip 安装 polars[gpu] 并将 [engine=”gpu”] 发送至 collect 操作,即可将 GPU 加速应用于他们的工作流。在后台,Polars 会尝试首先在 GPU 上执行操作,必要时再返回 CPU。这种方法可确保:

通过使用 Polars 的查询优化器,实现高效执行和最低内存使用

用户无须修改现有 Polars 代码,即可访问 GPU 引擎

完全兼容 Polars 不断发展的数据可视化、I/O 和机器学习库生态系统

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

结语

RAPIDS cuDF 驱动的 Polars GPU 引擎现已发布公测版,为各行各业的数据科学家和工程师提供了一种适用于中等规模数据处理的强大工具。该引擎最高能够将 NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不产生分布式系统开销的情况下,高效处理数亿行规模的数据集。Polars GPU 引擎直接内置在 Polars API 中,使所有用户都能轻松访问。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4924

    浏览量

    102770
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4698

    浏览量

    128665
  • 引擎
    +关注

    关注

    1

    文章

    360

    浏览量

    22524

原文标题:RAPIDS cuDF 驱动的 Polars GPU 引擎发布公测版

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA加速计算如何推动医疗健康

    近日,NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康、网络安全和制造等行业实现转型。他表示,
    的头像 发表于 11-20 09:10 136次阅读

    NVIDIA向开放计算项目捐赠Blackwell平台设计

    近日,在美国加利福尼亚州举行的 OCP 全球峰会上,NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放
    的头像 发表于 11-19 15:30 82次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 105次阅读

    NVIDIA Omniverse加速零售数字化转型

    大模型、生成式 AI、数字孪生技术等前沿科技启发了各行各业的新业务模态,在这一时代背景下 NVIDIA 作为 AI 技术的耕耘者、加速计算方面的领导者,看到了数字化浪潮中前所未有的变革,那么
    的头像 发表于 11-09 13:52 210次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算

    市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper  GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台,该平台是专为多租户
    发表于 10-30 09:33 113次阅读
    <b class='flag-5'>NVIDIA</b> 以太网<b class='flag-5'>加速</b> xAI 构建的全球最大 AI 超级<b class='flag-5'>计算</b>机

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力
    的头像 发表于 09-09 09:57 404次阅读
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平台提升<b class='flag-5'>计算</b>性能

    NVIDIA加速计算和生成式AI领域的创新

    在最新发布的公司 2024 财年可持续发展报告开篇的一封信中,NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA加速计算和生成式 AI 领域的创新,以及 AI 技术在提高生
    的头像 发表于 09-09 09:18 487次阅读

    借助NVIDIA超级计算加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 482次阅读

    NVIDIA加速计算和 AI助力数字银行揭穿金融欺诈骗局

    Bunq 利用 NVIDIA AI 将其欺诈检测模型的训练速度提高近百倍。   欧洲新型银行 Bunq 正在 NVIDIA 加速计算和 AI 的助力下,揭穿金融欺诈者的骗局。 被称为“
    的头像 发表于 06-27 17:41 781次阅读

    HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 变革

    by HPE 包含了可持续的加速计算产品组合以及全生命周期服务,简化 AI 创造价值的过程,加速生成式 AI 的发展步伐。 NVIDIA
    的头像 发表于 06-21 14:39 322次阅读

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

    作为极具开创性的一站式“交钥匙”私有云人工智能(private-cloud AI)解决方案,NVIDIA AI Computing by HPE 包含了可持续的加速计算产品组合以及全生命周期服务,
    的头像 发表于 06-20 17:36 671次阅读

    NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

    —— NVIDIA 于今日宣布通过开源的 NVIDIA CUDA-Q™ 量子计算平台,助力全球各地的国家级超算中心加快量子计算的研究发展
    发表于 05-13 15:21 182次阅读
    <b class='flag-5'>NVIDIA</b> 通过 CUDA-Q 平台为全球各地的量子<b class='flag-5'>计算</b>中心提供<b class='flag-5'>加速</b>

    Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

    中国上海,2024 年 3 月 25 日——楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布,公司深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作,推出两款变革性解决方案,利用
    的头像 发表于 03-25 14:36 555次阅读

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 540次阅读

    NVIDIA 初创加速计划 Omniverse 加速

    的重要力量。基于 NVIDIA 全栈式 AI 计算平台和 Omniverse TM 平台上的生成式 AI 创作实践,让企业、开发者能够了解可落地的生成式 AI 内容创作技术及其技术趋势与当前边界。 NVIDIA 初创
    的头像 发表于 12-04 20:35 617次阅读
    <b class='flag-5'>NVIDIA</b> 初创<b class='flag-5'>加速</b>计划 Omniverse <b class='flag-5'>加速</b>营