0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RDMA技术场景和参数优化

智能计算芯世界 来源:智能计算芯世界 作者:智能计算芯世界 2022-07-11 11:36 次阅读

RDMA是一种直接内存访问技术,RDMA 通过网络资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理功能。它消除了外部存储器复制和文本交换操作,因而能解放内存带宽和CPU 周期用于改进应用系统性能。这允许高通量、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。

常见的 RDMA 实现包括 iWARP、RoCE 与 InfiniBand。其中,InfiniBand 是超级计算机最常用的技术,其可以做到 1ms 的延迟及超过 100Gb 每秒的传输速率。这对于超大规模的计算机集群是必要的。超级计算机、人工智能云计算的数据中心都会受益于 InfiniBand 的卓越效能。世界 TOP500 超级计算机(2017年 6 月排行榜)中 36%使用了 InfiniBand 技术。

Mellanox 提供从 HPC(高性能计算中心)、数据中心、WEB2.0、机器学习、云服务器等解决方案,并专门针对目前火热的人工智能算法进行了架构优化。其客户包括 Facebook、Paypal、NVIDIA、百度、京东、腾讯等。

E级超算已经成为世界各国在超算领域追逐的新目标。目前,由江南计算所、国防科大和中科曙光公司根据不同技术路线研制的三台 E 级原型系统已经完成并分别安装在济南、天津和深圳国家超级计算中心。据 Hyperion Research 公司按照系统验收的时间估算,2021 至 2026 年期间,全球将建成 28~38 台 E 级或接近 E 级的超级计算机,总价值约在 100~150 亿美元。

1afa7050-00c2-11ed-ba43-dac502259ad0.png

在实现上,RDMA 实际上是一种智能网卡与软件架构充分优化的远端内存直接高速访问技术,通过将 RDMA 协议固化于硬件(即网卡)上,以及支持 Zero-copy和 Kernel bypass 这两种途径来达到其高性能的远程直接数据存取的目标。其通信过程使得用户在使用 RDMA 时具备如下优势:

➢ 零拷贝(Zero-copy) - 应用程序能够直接执行数据传输,在不涉及到网络软件栈的情况下。数据能够被直接发送到缓冲区或者能够直接从缓冲区里接收,而不需要被复制到网络层。

➢ 内核旁路(Kernel bypass) - 应用程序可以直接在用户态执行数据传输,不需要在内核态与用户态之间做上下文切换。

➢ 不需要 CPU 干预(No CPU involvement) - 应用程序可以访问远程主机内存而不消耗远程主机中的任何 CPU。远程主机内存能够被读取而不需要远程主机上的进程(或 CPU)参与。远程主机的 CPU 的缓存(cache)不会被访问的内存内容所填充。

➢ 消息基于事务(Message based transactions) - 数据被处理为离散消息而不是流,消除了应用程序将流切割为不同消息/事务的需求。

➢ 支持分散/聚合条目(Scatter/gather entries support) - RDMA 原生态支持分散/聚合。也就是说,读取多个内存缓冲区然后作为一个流发出去或者接收一个流然后写入到多个内存缓冲区里去。

目前,RDMA 技术在超算、AI 训练、存储等多个高性能场景大量部署,已形成广泛应用。但是 RDMA 技术路线也有很多,用户及各家厂商对于 RDMA 技术路线的选择也不尽相同。

在三种主流的 RDMA 技术中,可以划分为两大阵营。一个是 IB 技术, 另一个是支持 RDMA 的以太网技术(RoCE 和 iWARP)。其中,IBTA 主要聚焦 IB 和 RoCE 技术,而 iWARP 则是在 IEEE/IETF 标准化的技术。

在存储领域,支持 RDMA 的技术早就存在,比如SRP(SCSI RDMA Protocol)和iSER(iSCSI Extensions for RDMA)。如今兴起的 NVMe over Fabrics 如果使用的不是 FC 网络的话,本质上就是 NVMeover RDMA。换句话说,NVMe over InfiniBand, NVMe over RoCE 和 NVMe over iWARP 都是 NVMe over RDMA。

1、总线级数据中心网络技术白皮书.pdf

2、RDMA提高数据传输效率.pdf

3、配置 InfiniBand 和 RDMA 网络.pdf

4、华为RDMA.pdf

5、面向AI智能无损数据中心网络.pdf

6、面向分布式 AI智能网卡低延迟Fabric技术.pdf

7、NVMe存储SPDK 加速前后端 IO.pdf

8、基于RDMA多播机制的分布式持久性内存文件系统.pdf

9、云环境下分布式存储性能优化实践.pdf

《RDMA技术合集(上)》

1、智能网卡低延迟Fabric技术.pdf

2、RDMA参数选择.pdf

3、RDMA在数据中心中的应用研究.pdf

4、RDMA系统的挑战.pdf

5、RDMA网络人工智能训练重要硬件

6、RDMA技术白皮书(中文版)

7、RDMA技术调研

8、RDMA在数据中心中的应用研究

1b1870fa-00c2-11ed-ba43-dac502259ad0.png

1b299308-00c2-11ed-ba43-dac502259ad0.png

1b3ac83a-00c2-11ed-ba43-dac502259ad0.png

1b4b858a-00c2-11ed-ba43-dac502259ad0.png

1b6613b4-00c2-11ed-ba43-dac502259ad0.png

1b7aaa72-00c2-11ed-ba43-dac502259ad0.png

1b8e0c98-00c2-11ed-ba43-dac502259ad0.png

1b9da96e-00c2-11ed-ba43-dac502259ad0.png

1bb4e7f0-00c2-11ed-ba43-dac502259ad0.png

1bc7ba88-00c2-11ed-ba43-dac502259ad0.png

1bd7793c-00c2-11ed-ba43-dac502259ad0.png

1bec466e-00c2-11ed-ba43-dac502259ad0.png

1bfa5628-00c2-11ed-ba43-dac502259ad0.png

1c0cbd40-00c2-11ed-ba43-dac502259ad0.png

1c22b8e8-00c2-11ed-ba43-dac502259ad0.png

1c3fdacc-00c2-11ed-ba43-dac502259ad0.png

1c580d40-00c2-11ed-ba43-dac502259ad0.png

1c6e438a-00c2-11ed-ba43-dac502259ad0.png

1c8270c6-00c2-11ed-ba43-dac502259ad0.png

1c9f9688-00c2-11ed-ba43-dac502259ad0.png

1cb32734-00c2-11ed-ba43-dac502259ad0.png

1cbdb906-00c2-11ed-ba43-dac502259ad0.png

1cdaf070-00c2-11ed-ba43-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7452

    浏览量

    163596
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132402
  • RDMA
    +关注

    关注

    0

    文章

    76

    浏览量

    8925

原文标题:RDMA技术场景和参数优化

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电子天线罩测试仪的技术原理和应用场景

    电子天线罩测试仪,如罗德与施瓦茨公司开发的R&S®QAR50,是一种高质量的汽车电子天线罩测试仪。以下是其技术原理和应用场景的详细解释:一、技术原理 微波成像技术: R&am
    发表于 11-20 14:19

    OTA测试暗箱的技术原理和应用场景

    OTA测试暗箱在无线通信设备的研发与测试中扮演着至关重要的角色。以下是对OTA测试暗箱技术原理和应用场景的详细阐述:一、OTA测试暗箱的技术原理OTA测试暗箱的技术原理主要基于电磁波在
    发表于 11-14 14:36

    电感器TSMI252012PMX的技术参数与应用解析

    本文档详细介绍了电感器型号TSMI252012PMX的关键技术参数,如外形尺寸、额定电流、饱和电流等,并提供了可靠性测试条件及其结果。同时,文档还描述了TSMI252012PMX的应用场景,涵盖便携
    发表于 11-13 21:50

    信令测试仪器的技术原理和应用场景

    的状态和参数,如信号强度、接通率、时延等,还可以进行信令流量分析、信令交互分析和故障诊断等。 二、应用场景信令测试仪器在通信系统的开发、部署、运维以及优化过程中发挥着重要作用,具体应用场景
    发表于 10-31 14:45

    便携式示波器的技术原理和应用场景

    便携式示波器作为示波器的一种,具有体积小、重量轻、便于携带等特点,在多个领域有着广泛的应用。以下是对其技术原理和应用场景的详细介绍:一、技术原理便携式示波器的基本原理与传统示波器相同,都是通过采集
    发表于 10-24 14:31

    实时示波器的技术原理和应用场景

    实时示波器是一种高性能的电子测量仪器,其技术原理和应用场景对于电子工程和通信技术领域具有重要意义。以下是对实时示波器的技术原理和应用场景的详
    发表于 10-23 14:22

    以太网RDMA RoCE的技术局限

    上期我们讲到了RDMA的WHY,WHAT & HOW(AI网络背景下RDMA的Why,What & How),这一期我们来谈一谈RDMA的不足。
    的头像 发表于 10-22 10:02 213次阅读
    以太网<b class='flag-5'>RDMA</b> RoCE的<b class='flag-5'>技术</b>局限

    参数分析仪的技术原理和应用场景

    参数分析仪的技术原理和应用场景因其具体类型和用途的不同而有所差异。以下是对参数分析仪技术原理和应用场景
    发表于 10-17 14:42

    LCR数字电桥的技术原理和应用场景

    LCR数字电桥是一种高精度的电子测量仪器,其技术原理和应用场景可以详细阐述如下:技术原理LCR数字电桥基于电学滤波理论和数字技术,通过信号源、自动调谐电路、比例放大器以及A/D转换器等
    发表于 09-19 16:47

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬
    发表于 03-12 08:09

    利用CXL技术重构基于RDMA的内存解耦合

    本文提出了一种基于RDMA和CXL的新型低延迟、高可扩展性的内存解耦合系统Rcmp。其显著特点是通过CXL提高了基于RDMA系统的性能,并利用RDMA克服了CXL的距离限制。
    发表于 02-29 10:05 2586次阅读
    利用CXL<b class='flag-5'>技术</b>重构基于<b class='flag-5'>RDMA</b>的内存解耦合

    RDMA RNIC虚拟化方案

    远程直接内存访问(Remote Direct Memory Access,RDMA技术允许应用程序绕过操作系统内核,以零拷贝的方式和远程计算机进行网络通信,具有低延迟和高带宽的优势。RDMA协议
    的头像 发表于 01-23 17:23 1795次阅读
    <b class='flag-5'>RDMA</b> RNIC虚拟化方案

    深入了解RDMA技术

    Explorer,专注于高性能网络、虚拟化网络及网卡的测试方案研究。熟悉dpdk,rdma,sdn等技术的应用与解决方案。
    的头像 发表于 12-26 09:23 1609次阅读
    深入了解<b class='flag-5'>RDMA</b><b class='flag-5'>技术</b>

    rdma网络是什么?RDMA网络有什么应用场景

    RDMA(Remote Direct Memory Access)网络是一种技术,它通过网络直接在计算机之间传输数据,而无需双方操作系统的介入。这种技术可以允许高吞吐、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。
    的头像 发表于 12-22 09:30 1098次阅读

    RDMA和TCP/IP有什么区别

    在分布式存储网络中,我们使用的协议有RoCE、Infiniband(IB)和TCP/IP。其中RoCE和IB属于RDMA (RemoteDirect Memory Access)技术,他和传统的TCP/IP有什么区别呢,接下来我们将做详细对比。
    的头像 发表于 11-30 09:19 1672次阅读
    <b class='flag-5'>RDMA</b>和TCP/IP有什么区别