将NVIDIA加速计算引入Polars-电子发烧友网

Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎，该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍，使数据科学家仅在一台机器上就能实现在数秒内处理数亿行数据。

日新月异的数据挑战

Pandas 等传统数据处理库均为单线程，当处理数据超过数百万行时就会显得“力不从心”。分布式数据处理系统虽然可以处理数十亿行数据，但又会增加处理中小型数据集的复杂程度和经费开支。

在高效处理数千万至数亿行数据的工具之间一直存在着差距。这类工作负载常见于金融、零售、制造等行业的模型开发、需求预测和物流中。

在面向数据科学家和工程师的 Python 库中，Polars 的增长速度位居前列，其设计初衷就是为了应对这些挑战。该程序库使用了先进的查询优化技术，以减少不必要的数据移动和处理，使数据科学家可以仅用一台机器就能流畅地处理数亿行规模的工作负载。Polars 弥补了单线程解决方案速度过慢和分布式系统会增加非必要复杂性的缺陷，提供了一个极具吸引力的“中等规模”数据处理解决方案。

将 NVIDIA 加速计算引入 Polars

与其他仅使用 CPU 的数据处理工具相比，Polars 利用多线程执行、高级内存优化和惰性求值（lazy evaluation）功能，可显著提升开箱即用的加速性能。

但由于各行各业的企业面临日益增长的数据处理需求，例如需要分析数十亿笔金融交易、管理复杂的库存系统等，都需要更加强大的性能。这时就该轮到加速计算发挥作用了：

cuDF 是 NVIDIA CUDA-X 加速库中的 RAPIDS 套件的一部分，它是一个由 GPU 提供加速的 DataFrame 程序库，能够利用 GPU 的大规模并行处理能力显著提高数据处理性能。

Polars 团队与 NVIDIA 一起将 cuDF 的速度与 Polars 的效率相结合，使性能最高提速至在 CPU 上 Polars 的 13 倍。如此，即便用户的数据处理工作量增长到数亿甚至数十亿行数据，依然能够保持交互。

图 1.图中所示的是 PDS-H 基准测试 22 个查询中加速幅度最大的 4 个查询。在运行包含众多复杂分组和连接操作的查询时，RAPIDS cuDF 驱动的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基准测试规模系数 80 | GPU：NVIDIA H100 | CPU：英特尔 Xeon W9-3495X（Sapphire Rapids） | 存储：本地NVMe。备注：PDS-H 源自 TPC-H，但这些结果与 TPC-H 的结果不具有可比性。

由于 Polars GPU 引擎直接内置在 Polars Lazy API 中，用户只需通过 pip 安装 polars[gpu] 并将 [engine=”gpu”] 发送至 collect 操作，即可将 GPU 加速应用于他们的工作流。在后台，Polars 会尝试首先在 GPU 上执行操作，必要时再返回 CPU。这种方法可确保：

通过使用 Polars 的查询优化器，实现高效执行和最低内存使用

用户无须修改现有 Polars 代码，即可访问 GPU 引擎

完全兼容 Polars 不断发展的数据可视化、I/O 和机器学习库生态系统

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

结语

RAPIDS cuDF 驱动的 Polars GPU 引擎现已发布公测版，为各行各业的数据科学家和工程师提供了一种适用于中等规模数据处理的强大工具。该引擎最高能够将 NVIDIA GPU 上的 Polars 工作流速度提速 13 倍，可以在不产生分布式系统开销的情况下，高效处理数亿行规模的数据集。Polars GPU 引擎直接内置在 Polars API 中，使所有用户都能轻松访问。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5104

浏览量
104375
gpu

gpu

+关注

关注
28

文章
4828

浏览量
129746
引擎

引擎

+关注

关注
1

文章
362

浏览量
22687

原文标题：RAPIDS cuDF 驱动的 Polars GPU 引擎发布公测版

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

利用NVIDIA DPF引领DPU加速云计算的未来

越来越多的企业开始采用加速计算，从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架（DPF)，该框架提供了基础构建模块来释放 NVIDIA Blu

发表于 01-24 09:29 •298次阅读

利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

NVIDIA预测2025年AI行业发展

NVIDIA 加速计算、数据科学和研究领域专家预测，多模态模型将推动行业创新和效率提升。

发表于 12-18 13:49 •638次阅读

《CST Studio Suite 2024 GPU加速计算指南》

的各个方面，包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA GPU：详细列出了支持

发表于 12-16 14:25

NVIDIA加速全球大多数超级计算机推动科技进步

HPCwire 读者和编辑选择奖。自 2006 年发布 CUDA 以来，NVIDIA 不断推动 AI 和加速计算的进步，最新发布的全球最强超级计算机 TOP500 榜单突显了该公司

发表于 11-24 14:38 •439次阅读

<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多数超级<b class='flag-5'>计算</b>机推动科技进步

NVIDIA发布cuPyNumeric加速计算库

该加速计算库帮助科研人员无缝地扩展到强大的计算集群，并且无需修改 Python 代码，推进科学发现。

发表于 11-21 10:05 •417次阅读

NVIDIA加速计算如何推动医疗健康

近日，NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康、网络安全和制造等行业实现转型。他表示，

发表于 11-20 09:10 •415次阅读

NVIDIA向开放计算项目捐赠Blackwell平台设计

近日，在美国加利福尼亚州举行的 OCP 全球峰会上，NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放计

发表于 11-19 15:30 •323次阅读

日本企业借助NVIDIA产品加速AI创新

日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。

发表于 11-19 14:34 •532次阅读

利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

DolphinDB 是一家高性能数据库研发企业，也是 NVIDIA 初创加速计划成员，其开发的产品基于高性能分布式时序数据库，是支持复杂计算和流数据分析的实时计算平台，适用于金融、电力

发表于 09-09 09:57 •574次阅读

NVIDIA在加速计算和生成式AI领域的创新

在最新发布的公司 2024 财年可持续发展报告开篇的一封信中，NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA 在加速计算和生成式 AI 领域的创新，以及 AI 技术在提高生

发表于 09-09 09:18 •709次阅读

借助NVIDIA超级计算机加速量子计算发展

科学期刊《自然》（Nature）本月早些时候发表了一项研究，通过使用 NVIDIA 驱动的超级计算机，验证了量子计算的商业化途径。

发表于 07-25 09:55 •627次阅读

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

by HPE 包含了可持续的加速计算产品组合以及全生命周期服务，将简化 AI 创造价值的过程，加速生成式 AI 的发展步伐。 NVIDIA

发表于 06-21 14:39 •464次阅读

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

作为极具开创性的一站式“交钥匙”私有云人工智能（private-cloud AI）解决方案，NVIDIA AI Computing by HPE 包含了可持续的加速计算产品组合以及全生命周期服务，

发表于 06-20 17:36 •834次阅读

NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

—— NVIDIA 于今日宣布将通过开源的 NVIDIA CUDA-Q™ 量子计算平台，助力全球各地的国家级超算中心加快量子计算的研究发展

发表于 05-13 15:21 •250次阅读

Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计

中国上海，2024 年 3 月 25 日——楷登电子（美国 Cadence 公司，NASDAQ：CDNS）近日宣布，公司将深化与 NVIDIA 在 EDA、系统设计与分析、数字生物学和人工智能领域的多年合作，推出两款变革性解决方案，利用

发表于 03-25 14:36 •738次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

将NVIDIA加速计算引入Polars

评论

利用NVIDIA DPF引领DPU加速云计算的未来

NVIDIA预测2025年AI行业发展

《CST Studio Suite 2024 GPU加速计算指南》

NVIDIA加速全球大多数超级计算机推动科技进步

NVIDIA发布cuPyNumeric加速计算库

NVIDIA加速计算如何推动医疗健康

NVIDIA向开放计算项目捐赠Blackwell平台设计

日本企业借助NVIDIA产品加速AI创新

利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

NVIDIA在加速计算和生成式AI领域的创新

借助NVIDIA超级计算机加速量子计算发展

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

Cadence与NVIDIA联合推出利用加速计算和生成式AI重塑设计