0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC 研究人员借助 NVIDIA BlueField DPU 为网络计算的未来打下坚实基础

21克888 来源:厂商供稿 作者:NVIDIA 2022-05-31 14:58 次阅读

全球的超级计算中心都在纷纷利用NVIDIA Quantum InfiniBand网络上的NVIDIA BlueField DPU将加速计算提升到一个新的水平


在欧洲和美国,HPC开发者正在利用NVIDIA BlueField-2 DPU内的Arm核和加速器的强大功能为超级计算机提供强大助力。

美国洛斯阿拉莫斯国家实验室(LANL)正在与NVIDIA进行一项为期多年的广泛合作,这项合作旨在将计算型多物理应用的性能提高30倍。

LANL研究人员预计,使用在NVIDIA Quantum InfiniBand网络上运行的DPU(数据处理器)可显著提升性能。这将使利用BlueField以及NVIDIA DOCA软件框架在计算存储、模式匹配等领域实现技术创新。

面向DPU的开放式API

这些努力还将有助于进一步定义OpenSNAPI,任何人都可通过该应用接口来控制DPU。这是统计计算框架( Unified Communication Framework)的一个项目,Unified Communication Framework是一个旨在实现HPC应用异构计算的联盟,成员包括Arm、IBM、NVIDIA、美国国家实验室和美国的一些大学。

LANL已经感受到网络计算的强大功能,这要归功于其创建的DPU赋能的存储系统。

加速闪存盒(ABoF,如下图所示)将固态存储与DPU和InfiniBand加速器相结合,可为Linux文件系统的关键性能部分提供加速。它的性能高达同类存储系统的30倍,并将成为LANL基础架构中的关键组件。

一位研究人员在近期的LANL博客中表示:“ABoF让计算靠近存储,可更大限度减少数据移动,从而提高仿真和数据分析工作流程的效率。”

德克萨斯州打造出云原生超级计算平台

德克萨斯高级计算中心(TACC)近期也开始在Dell PowerEdge服务器中采用BlueField-2。它将在InfiniBand网络上使用DPU,使其Lonestar6系统成为云原生超级计算的开发平台。

TACC的Lonestar6为德州农工大学、德州理工大学和北德克萨斯大学的众多HPC开发者,以及一些研究中心和教职人员提供服务。

MPI获得加速

在距TACC东北部1200英里的地方,俄亥俄州立大学的研究人员展示了DPU如何将一个HPC热门编程模型的运行速度提高26%。

他们通过卸载消息传递接口(MPI)的关键部分,加速了P3DFFT,这是一个用于众多大规模HPC仿真的数学库。

俄亥俄州立大学计算机科学与工程专业的教授Dhabaleswar K. (DK) Panda在其带领的MVAPICH开源软件团队推动DPU工作,他表示:“DPU就像是为忙碌的高管处理工作的助手,它们将成为主流,因为它们可以加速运行各种工作负载。”

HPC中心和云中的DPU


对于运行药物研发或飞机设计等HPC仿真应用的超级计算机而言,高达两位数的性能加速是惊人的。Panda表示,云服务可以利用这些加速提高客户的生产力,他已收到多个HPC中心的代码请求。

Quantum InfiniBand网络以及NVIDIA SHARP特性,助力他高效完成工作。

他说:“其他人还在谈论网络计算,而InfiniBand已经在为它提供支持。”

达勒姆开发负载均衡


欧洲的多个研究团队正利用BlueField DPU加速MPI和其他HPC工作负载。

例如,英格兰北部的达勒姆大学正在开发一款软件,用于在16个节点的Dell PowerEdge集群上使用BlueField DPU以实现MPI作业的负载均衡。该项目的首席调查员Tobias Weinzierl表示,该软件将为全球各地的HPC设施更高效地处理更好算法铺平道路。

剑桥大学和慕尼黑的DPU应用

剑桥大学、伦敦和慕尼黑的研究人员也在使用DPU。

伦敦大学学院正在探索如何在BlueField-2 DPU上为主机系统调度作业。例如,可以使用它的能力在主机处理器之间移动数据,以便在需要时数据已然就位。

Dell PowerEdge服务器内的BlueField DPU可为Cambridge Service for Data Driven Discovery服务卸载主机CPU的安全策略、存储框架和其他作业,从而更大限度地提高系统性能。

与此同时,慕尼黑工业大学计算机体系架构和并行系统组的研究人员正在寻找方法,使用DPU来卸载MPI和操作系统任务,这是EuroHPC项目的一部分。

在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用BlueField-2 DPU加速分子动力学研究。一篇论文描述了他们目前的工作成果,其中表明,算法可以加速高达20%,且不会损失模拟的准确性。

不断扩展的网络


本月早些时候,日本研究人员宣布将推出一款采用新版NVIDIA H100 Tensor Core GPU的系统,该系统将搭载速度更快、更智能的NVIDIA Quantum-2 InfiniBand网络平台。

NEC将使用H100的为筑波大学计算科学中心构建算力大约为6 PFLOPS超级计算机。研究人员将使用该系统实现气候学、天体物理学、大数据、AI和更多方面的研究。

与此同时,Panda等研究人员已经开始考虑如何使用BlueField-3 DPU的核心功能。

他打趣道:“这就像雇佣拥有大学学位的行政助理,而不是那些拥有高中文凭的行政助理一样,所以我希望能够完成越来越多的工作卸载。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37744
  • HPC
    HPC
    +关注

    关注

    0

    文章

    311

    浏览量

    23678
  • 网络计算机
    +关注

    关注

    0

    文章

    3

    浏览量

    6562
收藏 人收藏

    评论

    相关推荐

    HPC计算前景

    高性能计算HPC)与云计算的结合,正逐步成为推动科技创新和产业升级的重要引擎。随着数据规模的不断扩大和计算需求的日益复杂,HPC
    的头像 发表于 10-16 10:17 179次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 485次阅读

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    AWS 与阿里云在 DPU 的应用方面也有成功案例,借助其软硬件全栈自研的优势,快速完成了云计算系统的改造工作,实现了 DPU 大规模落地部署,在降低自身运营成本的同时
    发表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDIA
    的头像 发表于 06-27 17:31 724次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便 NVIDIA BlueField DPU 和 SuperNI
    的头像 发表于 05-29 09:22 458次阅读

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。
    的头像 发表于 05-14 09:17 382次阅读
    助力科学发展,<b class='flag-5'>NVIDIA</b> AI加速<b class='flag-5'>HPC</b><b class='flag-5'>研究</b>

    是德科技与NVIDIA携手推进6G研究云平台发展

    研究人员提供了全面而强大的工具集,助力他们在无线接入网(RAN)领域探索并开发人工智能(AI)新技术。
    的头像 发表于 03-27 09:26 671次阅读

    基于NVIDIA开源CUDA-Q量子计算平台发布

    NVIDIA 于太平洋时间 3 月 18 日推出一项云服务,旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究
    的头像 发表于 03-21 09:54 401次阅读

    NVIDIA推出6G研究云平台,以AI推动无线通信的发展

    NVIDIA 于今日宣布推出一个 6G 研究平台,该平台研究人员提供了一种开发下一阶段无线技术的新方法。
    的头像 发表于 03-20 09:50 400次阅读

    NVIDIA 推出云量子计算机模拟微服务

    —— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日推出一项云服务,旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算
    发表于 03-19 11:27 404次阅读
    <b class='flag-5'>NVIDIA</b> 推出云量子<b class='flag-5'>计算</b>机模拟微服务

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPUNVIDIA
    的头像 发表于 02-23 10:02 428次阅读

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高
    的头像 发表于 02-19 13:27 789次阅读
    什么是<b class='flag-5'>HPC</b>高性能<b class='flag-5'>计算</b>

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    实践 最后一部分是数据加速应用的落地: 基于各个平台的算力解决方案 推荐的存储解决方案 边缘计算方案 网络平台与融合加速技术 本书不能帮你完全入门DOCA和相关的DPU开发技术,但是能够帮读者建立起一
    发表于 12-24 10:54

    《数据处理器:DPU编程入门》读书笔记

    AI、机器学习、安全、电信和存储等应用,并提升性能,减轻虚拟化Hypervisor的工作负载。同时,它还具备开放性集成功能,未来支持更多功能集成。NVIDIADPU还提供统一的面向各种应用的编程接口
    发表于 12-21 10:47

    《数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    BlueField-3 DPU 的关键软件定义、硬件加速应用包括: 1.云网络:云覆盖、SDN 加速、NAT、负载均衡等。 NVIDIA Blue
    发表于 12-08 18:03