0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU为高性能计算系统提供空前的创新空间

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-09-12 10:17 次阅读

为了满足更先进的科研需求,全球各地的学术机构都在致力于重新设计代码和算法。英国的面向 E 级计算算法和基础设施优化的 ExCALIBUR (the Exascale Computing ALgorithms and Infrastructures Benefiting UK Research) 项目就是这样一个致力于为英国最重要的研究领域提供新一代高性能模拟软件的科研项目。这些领域涉及到计算高度密集型的应用,例如模拟整个宇宙的演变、了解地震波和引力波、评估海啸以及对物质的基本结构进行建模等。

新型计算方案的出现,包括智能且可编程的互连解决方案如 DPU(数据处理器)等,为研究人员在新的高性能计算系统上提供了空前的创新空间。NVIDIA BlueField DPU 集强大的网络计算引擎、高速网络和丰富的可编程性于一体,为最苛刻的应用提供了软件定义、硬件加速的解决方案。

拥有分布在剑桥大学、莱斯特大学、杜伦大学和爱丁堡大学这四所大学的计算资源的 DiRAC(Distributed Research utilising Advanced Computing)正在参与ExCALIBUR 项目,正在以全新的方式利用 BlueField DPU 丰富的可编程能力助力科学突破。

例如杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

伦敦大学学院的研究生 James Legg 正在使用 BlueField DPU 通过使用基于任务的调度机制来加速计算代码。James 的研究方向就是使用 BlueField DPU,尤其是其 Arm 处理器子系统来作为任务调度器,由主机处理器来运行计算任务或内核。这颠覆了传统的加速卡运行在内核,由主机来管理所有任务的认知。以前,当调度器和内核都在主机上运行时,它们会强夺处理器资源,使得调度器的设计必须简单。在 BlueField DPU 上,调度器可以轻松拥有几个专用线程,实现了调度处理和与主机运行内核的并行化,并可以执行更复杂的调度操作。另外一项研究是如何在主机处理器完全不参与的情况下,利用 BlueField DPU 上的调度器在任意主机 RAM 之间移动计算数据。

CSD3 (Cambridge Service for Data Driven Discovery)是英国国家研究云,同时也是世界上性能最强大的科研云原生超级计算机之一。CSD3 通过 BlueField DPU 来卸载主机上的安全策略和存储框架等基础设施管理操作,同时提供了应用的加速与隔离,以此实现了 I/O 性能的最大化。这既实现了安全性又得到了裸金属性能,使研究人员能够以全新的方式进行研究。

以上只是研究人员如何利用 DPU 性能和可编程性来探索创新的一部分。为了进一步简化编程,加速创新,NVIDIA 推出了 DOCA SDK,使基础设施开发人员能够使用行业标准的 API,在 BlueField DPU 上快速创建网络、存储、安全、管理以及 AI 和高性能计算(HPC)应用和服务。凭借 DOCA,开发人员可以通过创建高性能、软件定义和云原生的 DPU 加速服务,对未来的超级计算基础设施进行编程。现在,开发人员即可通过注册提前体验。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4994

    浏览量

    103180
  • DPU
    DPU
    +关注

    关注

    0

    文章

    364

    浏览量

    24205

原文标题:DPU 助力英国高性能计算研究人员创新和改进超算基础设施

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    NEXT的原生页面高性能解决方案,从页面滑动、跳转及应用冷启动等关键环节,开发者提供全面的支持。目前,这些解决方案均已上线OpenHarmony开源社区,可在OpenHarmony三方库中心仓进行搜索,欢迎开发者多多使用和共
    发表于 01-02 18:00

    Triton编译器在高性能计算中的应用

    先进的编译技术,高性能计算提供了强大的支持。 Triton编译器简介 Triton编译器是一种开源的编译器框架,旨在为异构计算环境
    的头像 发表于 12-25 09:11 234次阅读

    AI高性能计算平台是什么

    AI高性能计算平台不仅是AI技术发展的基石,更是推动AI应用落地、加速产业升级的重要工具。以下,是对AI高性能计算平台的介绍,由AI部落小编为您整理分享。
    的头像 发表于 11-11 09:56 206次阅读

    如何理解云计算

    的问题。 **提供高性能计算资源:**云服务提供商通常会部署大规模的服务器集群,用户可以通过云平台来使用这些服务器提供
    发表于 08-16 17:02

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    AWS 与阿里云在 DPU 的应用方面也有成功案例,借助其软硬件全栈自研的优势,快速完成了云计算系统的改造工作,实现了 DPU 大规模落地部署,在降低自身运营成本的同时
    发表于 07-24 15:32

    带你了解什么是高性能计算(HPC)

    受益于HPC更高的速度处理大量数据的能力,全球正在进入HPC大周期,高性能计算的发展水平已经成为衡量一个国家综合实力和高科技发展水平的重要标志,美国、欧盟、日本、英国都高度重视高性能计算
    的头像 发表于 07-20 08:28 606次阅读
    带你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>(HPC)

    芯品# 高性能计算芯片

    (LSE:AWE)是全球技术基础设施高速连接和计算芯片的全球领导者,与Arm合作开发基于Arm ® Neoverse™计算子系统(CSS)的高级计算芯片,用于人工智能/机器学习(AI/ML),
    的头像 发表于 06-27 10:28 7006次阅读

    高性能计算集群的能耗优化

    高性能计算(HighPerformanceComputing,HPC)是指利用大规模并行计算机集群来解决复杂的科学和工程问题的技术。高性能计算
    的头像 发表于 05-25 08:27 446次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群的能耗优化

    构建高性能计算芯片

    计算的异构多核架构,对整个芯片行业的高性能 CPU 开发产生了影响。 这些芯片都不太可能进行商业销售。它们针对特定的数据类型和工作负载进行了优化,设计预算庞大,但可以通过提高性能和降低功耗来实现合理化。目标是在更小的面积上容纳更
    的头像 发表于 04-25 10:23 1333次阅读
    构建<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>芯片

    兆芯携手智云创新推出高性能NVMe企业级存储系统

    面向持续增长的数字化转型与应用创新发展需求,兆芯携手智云创新,基于兆芯高性能自主处理器平台成功推出多款信创存储产品,包括高性能NVMe企业级存储系统
    的头像 发表于 04-12 14:06 575次阅读

    明天线上见!DPU构建高性能云算力底座——DPU技术开放日最新议程公布!

    技术在不同行业中的应用解决方案有哪些?能带来怎样的业务效果? 3月29日本周五,中科驭数集结产品大咖及解决方案专家团,诚邀您参加以“DPU构建高性能云算力底座”为主题的线上DPU技术开放日! 他们将逐一与您分享中科驭数系列
    的头像 发表于 04-03 18:12 1009次阅读

    兆易创新推出GD32F5系列Cortex®-M33内核MCU,提供工业高性能应用新选择

    自动化、PLC、网络通讯设备、图形显示等应用场景。GD32F5系列高性能MCU具备显著扩容的存储空间、优异的处理能效和丰富的接口资源,该系列MCU符合系统级IEC61
    的头像 发表于 03-16 08:22 589次阅读
    兆易<b class='flag-5'>创新</b>推出GD32F5系列Cortex®-M33内核MCU,<b class='flag-5'>提供</b>工业<b class='flag-5'>高性能</b>应用新选择

    星云智联金山云打造裸金属服务器DPU解决方案,助力高端用户实现更强大更高效的上云体验

    国内领先的DPU和智能网卡芯片与解决方案提供商星云智联近日宣布,与中国知名云服务商金山云共同开发了基于星云智联NebulaMatrix DPU解决方案的金山云裸金属产品,满足用户对高性能
    的头像 发表于 02-20 09:06 642次阅读

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高
    的头像 发表于 02-19 13:27 878次阅读
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    基于 GPU 渲染的高性能空间包围计算

    空间包围检测在计算机图形学、虚拟仿真、工业生产等有着广泛的应用。
    的头像 发表于 02-18 10:47 694次阅读
    基于 GPU 渲染的<b class='flag-5'>高性能</b><b class='flag-5'>空间</b>包围<b class='flag-5'>计算</b>