0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RDMA技术场景和参数优化

智能计算芯世界 来源:智能计算芯世界 作者:智能计算芯世界 2022-07-11 11:36 次阅读

RDMA是一种直接内存访问技术,RDMA 通过网络资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理功能。它消除了外部存储器复制和文本交换操作,因而能解放内存带宽和CPU 周期用于改进应用系统性能。这允许高通量、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。

常见的 RDMA 实现包括 iWARP、RoCE 与 InfiniBand。其中,InfiniBand 是超级计算机最常用的技术,其可以做到 1ms 的延迟及超过 100Gb 每秒的传输速率。这对于超大规模的计算机集群是必要的。超级计算机、人工智能云计算的数据中心都会受益于 InfiniBand 的卓越效能。世界 TOP500 超级计算机(2017年 6 月排行榜)中 36%使用了 InfiniBand 技术。

Mellanox 提供从 HPC(高性能计算中心)、数据中心、WEB2.0、机器学习、云服务器等解决方案,并专门针对目前火热的人工智能算法进行了架构优化。其客户包括 Facebook、Paypal、NVIDIA、百度、京东、腾讯等。

E级超算已经成为世界各国在超算领域追逐的新目标。目前,由江南计算所、国防科大和中科曙光公司根据不同技术路线研制的三台 E 级原型系统已经完成并分别安装在济南、天津和深圳国家超级计算中心。据 Hyperion Research 公司按照系统验收的时间估算,2021 至 2026 年期间,全球将建成 28~38 台 E 级或接近 E 级的超级计算机,总价值约在 100~150 亿美元。

1afa7050-00c2-11ed-ba43-dac502259ad0.png

在实现上,RDMA 实际上是一种智能网卡与软件架构充分优化的远端内存直接高速访问技术,通过将 RDMA 协议固化于硬件(即网卡)上,以及支持 Zero-copy和 Kernel bypass 这两种途径来达到其高性能的远程直接数据存取的目标。其通信过程使得用户在使用 RDMA 时具备如下优势:

➢ 零拷贝(Zero-copy) - 应用程序能够直接执行数据传输,在不涉及到网络软件栈的情况下。数据能够被直接发送到缓冲区或者能够直接从缓冲区里接收,而不需要被复制到网络层。

➢ 内核旁路(Kernel bypass) - 应用程序可以直接在用户态执行数据传输,不需要在内核态与用户态之间做上下文切换。

➢ 不需要 CPU 干预(No CPU involvement) - 应用程序可以访问远程主机内存而不消耗远程主机中的任何 CPU。远程主机内存能够被读取而不需要远程主机上的进程(或 CPU)参与。远程主机的 CPU 的缓存(cache)不会被访问的内存内容所填充。

➢ 消息基于事务(Message based transactions) - 数据被处理为离散消息而不是流,消除了应用程序将流切割为不同消息/事务的需求。

➢ 支持分散/聚合条目(Scatter/gather entries support) - RDMA 原生态支持分散/聚合。也就是说,读取多个内存缓冲区然后作为一个流发出去或者接收一个流然后写入到多个内存缓冲区里去。

目前,RDMA 技术在超算、AI 训练、存储等多个高性能场景大量部署,已形成广泛应用。但是 RDMA 技术路线也有很多,用户及各家厂商对于 RDMA 技术路线的选择也不尽相同。

在三种主流的 RDMA 技术中,可以划分为两大阵营。一个是 IB 技术, 另一个是支持 RDMA 的以太网技术(RoCE 和 iWARP)。其中,IBTA 主要聚焦 IB 和 RoCE 技术,而 iWARP 则是在 IEEE/IETF 标准化的技术。

在存储领域,支持 RDMA 的技术早就存在,比如SRP(SCSI RDMA Protocol)和iSER(iSCSI Extensions for RDMA)。如今兴起的 NVMe over Fabrics 如果使用的不是 FC 网络的话,本质上就是 NVMeover RDMA。换句话说,NVMe over InfiniBand, NVMe over RoCE 和 NVMe over iWARP 都是 NVMe over RDMA。

1、总线级数据中心网络技术白皮书.pdf

2、RDMA提高数据传输效率.pdf

3、配置 InfiniBand 和 RDMA 网络.pdf

4、华为RDMA.pdf

5、面向AI智能无损数据中心网络.pdf

6、面向分布式 AI智能网卡低延迟Fabric技术.pdf

7、NVMe存储SPDK 加速前后端 IO.pdf

8、基于RDMA多播机制的分布式持久性内存文件系统.pdf

9、云环境下分布式存储性能优化实践.pdf

《RDMA技术合集(上)》

1、智能网卡低延迟Fabric技术.pdf

2、RDMA参数选择.pdf

3、RDMA在数据中心中的应用研究.pdf

4、RDMA系统的挑战.pdf

5、RDMA网络人工智能训练重要硬件

6、RDMA技术白皮书(中文版)

7、RDMA技术调研

8、RDMA在数据中心中的应用研究

1b1870fa-00c2-11ed-ba43-dac502259ad0.png

1b299308-00c2-11ed-ba43-dac502259ad0.png

1b3ac83a-00c2-11ed-ba43-dac502259ad0.png

1b4b858a-00c2-11ed-ba43-dac502259ad0.png

1b6613b4-00c2-11ed-ba43-dac502259ad0.png

1b7aaa72-00c2-11ed-ba43-dac502259ad0.png

1b8e0c98-00c2-11ed-ba43-dac502259ad0.png

1b9da96e-00c2-11ed-ba43-dac502259ad0.png

1bb4e7f0-00c2-11ed-ba43-dac502259ad0.png

1bc7ba88-00c2-11ed-ba43-dac502259ad0.png

1bd7793c-00c2-11ed-ba43-dac502259ad0.png

1bec466e-00c2-11ed-ba43-dac502259ad0.png

1bfa5628-00c2-11ed-ba43-dac502259ad0.png

1c0cbd40-00c2-11ed-ba43-dac502259ad0.png

1c22b8e8-00c2-11ed-ba43-dac502259ad0.png

1c3fdacc-00c2-11ed-ba43-dac502259ad0.png

1c580d40-00c2-11ed-ba43-dac502259ad0.png

1c6e438a-00c2-11ed-ba43-dac502259ad0.png

1c8270c6-00c2-11ed-ba43-dac502259ad0.png

1c9f9688-00c2-11ed-ba43-dac502259ad0.png

1cb32734-00c2-11ed-ba43-dac502259ad0.png

1cbdb906-00c2-11ed-ba43-dac502259ad0.png

1cdaf070-00c2-11ed-ba43-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7378

    浏览量

    163181
  • 机器学习
    +关注

    关注

    66

    文章

    8308

    浏览量

    131952
  • RDMA
    +关注

    关注

    0

    文章

    74

    浏览量

    8902

原文标题:RDMA技术场景和参数优化

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    超声波测厚仪的技术原理和应用场景

    超声波测厚仪的技术原理和应用场景详细如下:技术原理超声波测厚仪利用超声波脉冲反射原理来测量材料的厚度。具体工作原理如下: 发射超声波脉冲:测厚仪的探头(也称为换能器)向被测物体发射一束高频超声波脉冲
    发表于 09-27 15:06

    LCR数字电桥的技术原理和应用场景

    LCR数字电桥是一种高精度的电子测量仪器,其技术原理和应用场景可以详细阐述如下:技术原理LCR数字电桥基于电学滤波理论和数字技术,通过信号源、自动调谐电路、比例放大器以及A/D转换器等
    发表于 09-19 16:47

    倾斜光栅的鲁棒性优化

    任务 **连接建模技术:倾斜光栅 可用的微结构建模技术 : 光栅阶数分析仪 参数变化分析仪 参数优化
    发表于 08-12 18:38

    PGA309温漂是否可以通过设置参数软件方式优化,如何优化

    1.PGA309温漂是否可以通过设置参数软件方式优化,如何优化? 2.针对可编程放大器,是否有数字输出的PGA系列产品?
    发表于 08-09 07:04

    KPU FLEXFLOW® -2100R是中科驭数完全自研的首款具备RDMA功能的DPU加速卡#RDMA

    DPURDMA
    中科驭数(北京)科技有限公司
    发布于 :2024年03月25日 18:40:59

    电子束光刻的参数优化及常见问题介绍

    本文从光刻图案设计、特征尺寸、电镜参数优化等方面介绍电子束光刻的参数优化,最后介绍了一些常见问题。
    的头像 发表于 03-17 14:33 725次阅读
    电子束光刻的<b class='flag-5'>参数</b><b class='flag-5'>优化</b>及常见问题介绍

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬
    发表于 03-12 08:09

    利用CXL技术重构基于RDMA的内存解耦合

    本文提出了一种基于RDMA和CXL的新型低延迟、高可扩展性的内存解耦合系统Rcmp。其显著特点是通过CXL提高了基于RDMA系统的性能,并利用RDMA克服了CXL的距离限制。
    发表于 02-29 10:05 2069次阅读
    利用CXL<b class='flag-5'>技术</b>重构基于<b class='flag-5'>RDMA</b>的内存解耦合

    RDMA RNIC虚拟化方案

    远程直接内存访问(Remote Direct Memory Access,RDMA技术允许应用程序绕过操作系统内核,以零拷贝的方式和远程计算机进行网络通信,具有低延迟和高带宽的优势。RDMA协议
    的头像 发表于 01-23 17:23 1426次阅读
    <b class='flag-5'>RDMA</b> RNIC虚拟化方案

    阿里云是如何使用RDMA技术

    在大规模incast场景下DCQCN并不能很好的工作,具体体现在: DCQCN是一种被动控制,在CC起作用之前可能已经出现了性能下降(比如ECN报文还没有返回,交换机buffer就已经出现了丢包)。
    发表于 01-11 17:37 1177次阅读
    阿里云是如何使用<b class='flag-5'>RDMA</b><b class='flag-5'>技术</b>

    深入了解RDMA技术

    Explorer,专注于高性能网络、虚拟化网络及网卡的测试方案研究。熟悉dpdk,rdma,sdn等技术的应用与解决方案。
    的头像 发表于 12-26 09:23 1425次阅读
    深入了解<b class='flag-5'>RDMA</b><b class='flag-5'>技术</b>

    rdma网络是什么?RDMA网络有什么应用场景

    RDMA(Remote Direct Memory Access)网络是一种技术,它通过网络直接在计算机之间传输数据,而无需双方操作系统的介入。这种技术可以允许高吞吐、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。
    的头像 发表于 12-22 09:30 981次阅读

    RDMA和TCP/IP有什么区别

    在分布式存储网络中,我们使用的协议有RoCE、Infiniband(IB)和TCP/IP。其中RoCE和IB属于RDMA (RemoteDirect Memory Access)技术,他和传统的TCP/IP有什么区别呢,接下来我们将做详细对比。
    的头像 发表于 11-30 09:19 1426次阅读
    <b class='flag-5'>RDMA</b>和TCP/IP有什么区别

    RDMA(远程直接内存访问)传输协议概述和应用案例

    人工智能 (AI) 的兴起极大地提高了对强大、高效和可扩展的网络传输协议的需求。本文深入探讨了 RDMA(远程直接内存访问)传输协议,并重点讨论 ROCEv2 协议,目前基于 ROCEv2 的 RDMA已经在一些超大规模数据中心中取代了 TCP。
    的头像 发表于 10-25 10:19 2169次阅读
    <b class='flag-5'>RDMA</b>(远程直接内存访问)传输协议概述和应用案例

    基于Corundum架构的100G RDMA网卡设计

    传统TCP/IP技术处理数据包需通过操作系统和其他软件层,导致数据在系统内存、处理器缓存和网络控制器缓存间频繁复制,增加了服务器CPU和内存的负担,特别是在网络带宽、处理器速度与内存带宽不匹配时,网络延迟会进一步加剧。RDMA技术
    的头像 发表于 10-24 10:47 1025次阅读
    基于Corundum架构的100G <b class='flag-5'>RDMA</b>网卡设计