0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA ConnectX智能网卡驱动RDMA通讯技术在分布式存储的应用

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-03 09:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA ConnectX 智能网卡及开源 UCX 框架帮助网易高性能 RDMA 网络通讯功能实现更优表现,助力网易通过 Curve 开源项目为 Apache BRPC 自主实现高性能的 RDMA 网络通讯。

网易亟需打造一款高吞吐和低延迟的分布式存储系统

如何为用户提供性能优异、易于部署的分布式存储系统,特别是如何在远程访问存储时提高吞吐和降低延迟是网易面临的主要挑战。虽然在自研的 Curve 开源项目下已经支持了 Apache BRPC ,并具备了一定的远程方位存储的网络通讯能力,但是并未实现对 RDMA 网络通讯的支持,并借助 RDMA 网络通讯能力来实现高吞吐和低延迟,从而提升整体开源云原生分布式存储系统的性能。

NVIDIA ConnectX 智能网卡

为网易 Curve 开源项目提供解决方案

网易的 Curve 开源项目下支持 Apache BRPC ,并自研实现了 RDMA 网络通讯功能,而其采用的 NVIDIA ConnectX 智能网卡及开源 UCX 框架的底层软硬件基础设施,帮助其更好地为用户提供兼顾高性能、易运维、低成本的弹性分布式存储解决方案。 Curve 是云原生计算基金会(CNCF)沙箱(Sandbox)项目,它是网易主导自研和开源的高性能、易运维、云原生的分布式存储系统,由块存储 CurveBS 和文件系统 CurveFS 两部分组成,可应用于主流的云原生基础设施平台:

对接 OpenStack 平台为云主机提供高性能块存储服务;

对接 Kubernetes 为其提供 RWO 、RWX 等类型的持久化存储卷;

对接 PolarFS 作为云原生数据库的高性能存储底座,完美支持云原生数据库的存算分离架构。

Curve 亦可作为云存储中间件,使用与 S3 兼容的对象存储作为数据存储引擎,为公有云用户提供高性价比的共享文件存储系统。 网易致力于通过 Curve 开源项目自主研发云原生的分布式存储系统,为不同应用场景下的存储需求,提供大容量、高性能、易运维、低成本的开源弹性存储解决方案。而其最新为 BRPC 自研的 RDMA 网络通讯功能,将会极大的简化 RDMA 网络通讯的实现和提升远程存储访问的性能,为 Curve 开源项目提供高性能、低延迟的本地和远程存储访问体验,同时提供良好的上层 API 兼容性和透明性,使 Curve 成为更为完善的云原生分布式存储系统,从而驱动其在开源的分布式存储领域得到广泛的应用。

NVIDIA ConnectX 智能网卡

助力 RDMA 网络通讯功能发挥优异性能

该 RDMA 网络通讯功能完美的运行在采用 NVIDIA ConnectX 智能网卡及开源 UCX 框架(NVIDIA 是开源项目 UCX 的核心成员和主要贡献者)的底层软硬件基础设施上,将会发挥出更优异的性能表现,满足用户对分布式存储系统高性能、低延迟的需求,并大幅降低主机 CPU 开销,为用户提供兼顾高性能、易运维、低成本的弹性分布式存储解决方案。 具体来说,网易在 NVIDIA Connect X 智能网卡的驱动下实现 UCX 框架中的 UCP(Unified Communication for Protocols):

极大简化了 RDMA 网络通讯在分布式存储应用场景下的实现,且支持的 RDMA 接口具有良好的 API 兼容性

基于高性能的 NVIDIA ConnectX 智能网卡,将实现更为出色的 RDMA 网络通讯性能,IO 时延得到极大改善

即时将 RDMA 网络通讯能力体现在 Curve 后续的开源软件版本中,驱动云原生分布式存储系统的广泛应用

如今,Curve 开源项目的 RDMA 网络通讯功能已经实现,将会在后续的 Curve 版本中发布。想要深入了解网易是如何为 BRPC 实现 RDMA 网络通讯功能,请点击“阅读全文”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5721

    浏览量

    110230
  • 分布式存储
    +关注

    关注

    4

    文章

    182

    浏览量

    20233
  • 智能网卡
    +关注

    关注

    1

    文章

    55

    浏览量

    12775

原文标题:NVIDIA ConnectX 智能网卡驱动 RDMA 通讯技术在分布式存储的应用

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Ceph 分布式存储教程资料大模型学习资料2026

    分片的并行读写。这种架构允许成千上万个训练节点同时并发读取数据流,将存储带宽线性扩展,确保数据输送管道能够“喂饱”饥渴的 GPU 算力集群。 二、 数据加载的极致优化:缓存策略与预取技术
    发表于 05-01 17:35

    2022全新版!Java分布式架构设计与开发实战(完结)

    2022全新版!Java分布式架构设计与开发实战(完结) 分库分表实战:Java海量数据存储架构设计 现代互联网应用中,随着业务规模的指数级增长,数据库性能瓶颈已成为制约系统发展的关键因素。当单
    发表于 03-30 15:20

    NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。
    的头像 发表于 11-21 09:19 6350次阅读
    <b class='flag-5'>在</b><b class='flag-5'>NVIDIA</b> DGX Spark平台上对<b class='flag-5'>NVIDIA</b> <b class='flag-5'>ConnectX</b>-7 200G<b class='flag-5'>网卡</b>配置教程

    PLC远程上下载分布式设备运维系统中的作用

    智能决策,成为提升运维效率、降低运营成本的核心工具。本文从技术原理、功能价值、应用场景三个维度,系统阐述其分布式设备运维中的关键作用。 一、技术
    的头像 发表于 11-14 16:51 1473次阅读

    如何解决分布式光伏计量难题?

    %。同时,可提升发电效率、降低发电成本的新型技术逐步落地,推动光伏系统向更高效、更紧凑的方向发展,进而对电表精度、数据更新速度及适配性方面也提出了更高要求。 分布式光伏遇计量难题 分布式
    的头像 发表于 11-07 14:55 483次阅读
    如何解决<b class='flag-5'>分布式</b>光伏计量难题?

    分布式光伏环境监测站的技术架构与应用实践

    分布式光伏环境监测站的技术架构与应用实践 柏峰【BF-GFQX】一、系统技术架构解析 分布式光伏环境监测站采用“感知层-传输层-应用层”三层架构设计,实现环境数据的全链路
    的头像 发表于 10-13 10:05 805次阅读
    <b class='flag-5'>分布式</b>光伏环境监测站的<b class='flag-5'>技术</b>架构与应用实践

    分布式智能展厅控制系统:打造AI互动展示新模式!

    近日,某江西某历史博物馆成功应用讯维全新分布式智能展厅控制系统,为数字展厅的音视频交互和环境控制带来了革新。讯维全新分布式智能展厅控制系统通过采用先进的
    的头像 发表于 09-24 16:23 940次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>智能</b>展厅控制系统:打造AI互动展示新模式!

    【节能学院】Acrel-1000DP分布式光伏监控系统奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小容量工商业
    的头像 发表于 08-23 08:04 3735次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统<b class='flag-5'>在</b>奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的
    的头像 发表于 08-22 10:51 3579次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统<b class='flag-5'>技术</b>方案

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、AI训练、高性能计算)的关键挑战。
    的头像 发表于 08-04 11:34 1906次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布
    的头像 发表于 07-14 11:15 1310次阅读

    分布式IO选型指南:2025年分布式无线远程IO品牌及采集控制方案详解

    近年来,随着工业物联网(IIoT)、智能制造和工业4.0的深入发展,分布式无线远程IO模块工业控制领域的应用愈发广泛。这种模块通过无线方式实现远程数据采集与控制,极大地提高了工业设施的灵活性和效率
    的头像 发表于 06-23 09:48 1563次阅读

    双电机分布式驱动汽车高速稳定性机电耦合控制

    摘要:为了利用所设计的双电机防滑差速驱动系统来提高分布式驱动汽车的动力学性能,在前期同轴耦合驱动控制理论研究的基础上,开展该车的高速稳定性机电耦合控制研究。建立并验证包含所设计
    发表于 06-18 16:37

    RDMA简介2之A技术优势分析

    数据包时,应用程序将要传输的数据拷贝到TCP/IP协议栈的BUFFER中,TCP/IP协议栈组包后,再经由驱动程序下发到网卡内的BUFFER中。右侧部分则为RDMA协议的通信过程,其将RDMA
    发表于 06-04 11:35

    分布式光伏电站在高原走红,背后靠什么“护航”

    监控系统的技术特点和典型应用案例,探讨其高原地区分布式光伏电站中的具体应用策略,包括系统架构、关键功能、优势分析以及实际部署中所面临的问题与对策,旨在为高原地区的
    的头像 发表于 05-30 13:41 968次阅读
    <b class='flag-5'>分布式</b>光伏电站在高原走红,背后靠什么<b class='flag-5'>在</b>“护航”