0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布cuPyNumeric加速计算库

NVIDIA英伟达 来源:NVIDIA英伟达 2024-11-21 10:05 次阅读

加速计算库帮助科研人员无缝地扩展到强大的计算集群,并且无需修改 Python 代码,推进科学发现。

无论研究纳米级电子行为,还是数百万光年之外的星系碰撞,众多科学家都面临着一个共同的挑战,那就是必须梳理数 PB 的数据,才能从中获得能够推动相关领域发展的洞察。

借助 NVIDIA cuPyNumeric 加速计算库,科研人员现在可以将他们的数据处理 Python 代码毫不费力地运行在基于 CPU 的笔记本电脑GPU 加速工作站、云服务器或大型超级计算机上。处理数据的速度越快,科学家们就能越快地针对有前景的数据点、值得研究的趋势以及实验调整做出决策。

想要跃进到加速计算,科研人员并不需要计算机科学方面的专业知识。他们只需使用熟悉的 NumPy 界面编写代码,或将 cuPyNumeric 应用于现有代码,并遵循最佳实践即可享受到卓越的性能和可扩展性。

一旦使用了 cuPyNumeric,他们就可以在一个或数千个 GPU 上运行代码,并且无需修改任何代码。

最新版 cuPyNumeric 现已在 Conda 和 GitHub 上发布,它支持 NVIDIA GH200 Grace Hopper 超级芯片、运行时自动进行资源配置以及改进的内存扩展。它还支持 HDF5,这种在科学界非常流行的文件格式有助于高效地管理大型的复杂数据。

SLAC 国家加速器实验室、洛斯阿拉莫斯国家实验室、澳大利亚国立大学、马萨诸塞大学波士顿分校、斯坦福大学湍流研究中心和印度国家支付公司等机构的科研人员均集成了 cuPyNumeric,这显著地改善了他们的数据分析工作流程。

少即是多:无需修改代码

即可享受到无限的 GPU 可扩展性

Python 是数据科学、机器学习和数值计算领域最常用的编程语言,被天文学、药物发现、材料科学和核物理等科学领域的数百万科研人员所使用。GitHub 上数以万计的软件包都依赖于 NumPy 数学和矩阵库,该库在上个月的下载量超过 3 亿次。所有这些应用都能受益于 cuPyNumeric 加速计算。

许多科学家都在构建使用 NumPy 的程序,并在一个仅采用 CPU 的节点上运行,这限制了其算法的吞吐量,无法处理电子显微镜、粒子对撞机和射电望远镜等仪器收集的日益庞大的数据集。

通过提供一个可扩展到数千个 GPU 的 NumPy 替代品,cuPyNumeric 帮助科研人员跟上数据集日益增长的规模和复杂性。从单个 GPU 扩展到整个超级计算机时,cuPyNumeric 不需要更改代码。这使得科研人员可以轻松地在任何规模的加速计算系统上运行分析。

解决大数据问题,加速科学发现

美国能源部下属的 SLAC 国家加速器实验室(由斯坦福大学运营)的科研人员发现,cuPyNumeric 可帮助他们更快地使用直线加速器相干光源进行 X 射线实验。

一个专注于半导体材料科学发现的 SLAC 团队发现,cuPyNumeric 将数据分析应用程序的速度提高了 6 倍,将运行时间从几分钟缩短到几秒钟。凭借这样的提速,该团队能够在这个高度专业化的设施内同时进行重要的分析和实验。

通过更高效地进行实验,该团队预计将能更快地发现新的材料特性、分享成果并发表论文。

以下机构也正在使用 cuPyNumeric:

澳大利亚国立大学的科研人员利用 cuPyNumeric 来扩展勒文伯格-马夸尔特优化算法,以便在澳大利亚国家计算基础设施中的多 GPU 系统上运行。虽然该算法可用于多种应用,但科研人员的最初目标是构建大规模的气候和天气模型。

洛斯阿拉莫斯国家实验室的科研人员正在运用 cuPyNumeric 来加速数据科学、计算科学和机器学习算法。cuPyNumeri 将为他们提供更多工具,以便有效地利用最近推出的 Venado 超级计算机,该超级计算机配备了 2,500 多颗 NVIDIA GH200 Grace Hopper 超级芯片。

斯坦福大学湍流研究中心的科研人员正在开发基于 Python 的计算流体动力学求解器,该求解器可使用 cuPyNumeric 在大型加速计算集群上大规模地运行。这些求解器可以将大型流体模拟集合与 PyTorch 等流行的机器学习库无缝集成,从而支持包括在线训练和强化学习在内的复杂应用。

马萨诸塞大学波士顿分校的一个研究团队正在加速线性代数计算,以分析显微镜视频并确定活性材料耗散的能量。该团队使用 cuPyNumeric 来分解一个包含 1600 万行和 4000 列的矩阵。

印度国家支付公司提供的实时数字支付系统每天大约被 2.5 亿印度人所用,并在走向全球。印度国家支付公司使用复杂的矩阵计算来跟踪付款人和收款人之间的交易路径。使用当前的方法,在 CPU 系统上处理一周的交易数据大约需要 5 个小时。一项试验表明,通过在多节点 NVIDIA DGX 系统上应用 cuPyNumeric 来加速计算,可以将矩阵乘法的速度提高 50 倍,从而使印度国家支付公司能够在不到一个小时的时间内处理更长时间内的交易,并近乎实时地检测到可疑的洗钱行为。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5093

    浏览量

    104059
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4806

    浏览量

    129593
  • 超级芯片
    +关注

    关注

    0

    文章

    36

    浏览量

    8935

原文标题:SC24 | NVIDIA 发布 cuPyNumeric,使科学家能够充分利用集群规模的 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    利用NVIDIA DPF引领DPU加速计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA Blu
    的头像 发表于 01-24 09:29 271次阅读
    利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

    简述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了对NVIDIA Isaac的重要更新。NVIDIA Isaac 是一个由加速、应用框架和 AI
    的头像 发表于 01-17 09:57 265次阅读
    简述<b class='flag-5'>NVIDIA</b> Isaac的重要更新

    《CST Studio Suite 2024 GPU加速计算指南》

    《GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024的GPU计算指南。涵盖GPU计算
    发表于 12-16 14:25

    NVIDIA加速全球大多数超级计算机推动科技进步

    HPCwire 读者和编辑选择奖。 自 2006 年发布 CUDA 以来,NVIDIA 不断推动 AI 和加速计算的进步,最新发布的全球最
    的头像 发表于 11-24 14:38 415次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多数超级<b class='flag-5'>计算</b>机推动科技进步

    NVIDIA加速计算如何推动医疗健康

    近日,NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康、网络安全和制造等行业实现转型。他表示,
    的头像 发表于 11-20 09:10 384次阅读

    NVIDIA向开放计算项目捐赠Blackwell平台设计

    近日,在美国加利福尼亚州举行的 OCP 全球峰会上,NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放
    的头像 发表于 11-19 15:30 298次阅读

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据,是支持复杂计算
    的头像 发表于 09-09 09:57 563次阅读
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平台提升<b class='flag-5'>计算</b>性能

    NVIDIA加速计算和生成式AI领域的创新

    在最新发布的公司 2024 财年可持续发展报告开篇的一封信中,NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA加速计算和生成式
    的头像 发表于 09-09 09:18 691次阅读

    借助NVIDIA超级计算加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 611次阅读

    HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 变革

    by HPE 包含了可持续的加速计算产品组合以及全生命周期服务,将简化 AI 创造价值的过程,加速生成式 AI 的发展步伐。 NVIDIA AI Computing by HPE 由
    的头像 发表于 06-21 14:39 445次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的应用程序和服务。
    的头像 发表于 05-29 09:22 578次阅读

    NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

    德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究     德国汉堡 —— 国际超算大会(ISC)—— 2024 年 5 月 13 日
    发表于 05-13 15:21 243次阅读
    <b class='flag-5'>NVIDIA</b> 通过 CUDA-Q 平台为全球各地的量子<b class='flag-5'>计算</b>中心提供<b class='flag-5'>加速</b>

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源,用于优化从 PC 到云端的
    的头像 发表于 04-28 10:36 678次阅读

    NVIDIA cuPQC帮助开发适用于量子计算时代的加密技术

    NVIDIA cuPQC 可为相关开发者提供加速计算支持,帮助开发适用于量子计算时代的加密技术。cuPQC 可利用 GPU 并行性,为要求
    的头像 发表于 03-22 09:53 524次阅读

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 661次阅读