0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让Ceph存储的性能飙升的原因竟然是因为它?

存储加速器 来源:YXQ 2019-07-05 15:11 次阅读

‍Ceph作为一款开源的分布式存储软件解决方案,由于其功能丰富、社区活跃,在公有云和私有云环境中有着广泛的应用。

然而,由于Ceph的大规模分布式架构原因,其IO路径过长,使得其性能一直被业界所诟病。

现实中,Ceph更多用在备份和归档等性能要求不高的场景。在这种场景下,一般存储介质采用HDD,很少采用全闪存的配置。

伴随着固态盘(SSD)价格的不断走低,云提供商纷纷开始着手为客户打造具备卓越性能和高可靠性的全闪存存储。

为此,他们迫切希望获得基于 Ceph 的全闪存参考架构,并了解具体的性能表现和最佳优化实践。

英特尔®傲腾™ 技术前所未有地集高吞吐量、低延迟、高服务质量和高耐用性优势于一身,它由 3D XPoint™ 内存介质和英特尔®软件等组合而成。

这些构建模块相互配合,配合至强可扩展处理器,在降低延迟和加速系统性能方面实现了具体提升,能够全面满足工作负载对于大容量和快速存储的需求。

本篇文章将围绕 Ceph 全闪存存储系统参考架构和基于英特尔®至强®可扩展处理器的软件优化等方面,介绍Intel所取得的进展。

在本文中,将重点为您介绍Ceph 参考架构和性能结果,该架构的配置包括 RADOS 块设备(RBD)接口、英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器产品家族(英特尔®至强®铂金 8180 处理器和英特尔®至强®金牌 6140 处理器)。

我们先介绍采用英特尔®傲腾™ 技术和英特尔®至强®可扩展处理器的Ceph 全闪存阵列(AFA)参考架构,然后介绍典型工作负载的性能结果和系统特性。

Intel建议Ceph AFA采用英特尔®至强®铂金 8180 处理器,它是英特尔®至强®可扩展处理器产品家族中先进的处理器。

建议使用英特尔®傲腾™ 固态盘(SSD)作为BlueStore WAL(Write-Ahead Logging) 设备,使用基于 NAND 固态盘作为数据硬盘,并使用 Mellanox 40 GbE 网络接口卡(NIC)作为高速以太网数据端口,具备最高性能(吞吐量和延迟)。它是 I/O 密集型工作负载的最佳选择。

测试系统由5个Ceph存储服务器和5个客户端节点组成。

每个存储节点配置Intel Xeon Platinum 8180处理器和384 GB内存,使用1x Intel Optane SSD DC P4800X 375GB作为BlueStore WAL设备,4x Intel SSD DC P3520 2TB作为数据驱动器,以及2x Mellanox 40 GbE NIC作为Ceph的独立集群和公共网络。

同时,每个节点均使用 Ceph 12.2.2,并且每个英特尔®固态盘 DC P3520 系列运行一个对象存储守护程序(OSD)。用于测试的 RBD 池配置有 2 个副本。

对于客户端,每个节点配置了英特尔®至强®铂金 8180 处理器、384 GB 内存和 1 个 Mellanox 40GbE 网卡。

Intel设计了四种不同的工作负载来模拟云中典型的全闪存 Ceph 集群(基于带 librbd 的 fio),其中包括 4K 随机读写和 64K 顺序读写,以分别模拟随机工作负载和顺序工作负载。对于每个测试用例,IO 性能(IOPS 或带宽)使用卷扩展数量(最大扩展到 100)来衡量,每个卷配置为 30 GB。

这些卷已预先分配,以消除 Ceph 精简配置机制的影响,获得稳定且可复制的结果。每次测试之前停止 OSD 页高速缓存,以消除页高速缓存的影响。在每个测试用例中,fio 配置了 300 秒的准备时限和 300 秒的数据采集时限。

4K随机写特性

用户空间消耗的CPU利用率为37%,占CPU总利用率的75%。分析结果显示Ceph OSD过程消耗了大部分CPU周期; CPU还有空间的可疑原因是软件线程和锁定模型实现限制了Ceph在单个节点上的扩展能力,这仍然是下一步优化工作。

4K随机写入的系统指标

4K随机读取特性

CPU利用率约为60%,其中IOWAIT约占15%,因此实际CPU消耗也约为45%;类似于随机写例。OSD磁盘的读取IOPS非常稳定在80K,40 GBbE NIC带宽约为2.1 GB/s。没有观察到明显的硬件瓶颈;疑似软件瓶颈类似于4K随机写入案例,需要进一步调查。

4K随机读取的系统指标

64K顺序写入特性

顺序写入的CPU利用率和内存消耗非常低。由于OSD复制数为2,因此NIC数据的传输带宽是接收带宽的两倍,传输带宽包括两个NIC的带宽,一个用于公共网络,一个用于群集网络,每个NIC大约1.8 GB /每个端口。OSD磁盘AWAIT时间受到严重波动,最高磁盘延迟超过4秒,而磁盘IOPS非常稳定。

64K顺序写入的系统指标

64K顺序读取特性

对于顺序读取案例,我们观察到一个NIC的带宽达到4.4 GB/s,约占总带宽的88%。顺序写入的CPU利用率和内存消耗非常低。OSD磁盘读取IOPS和延迟稳定。

64K顺序读取的系统指标

总体来看,基于英特尔Optane技术的Ceph AFA集群展示了出色的吞吐量和延迟。

64K顺序读写吞吐量分别为21,949 MB/s和8,714 MB/s(最大为40 GbE NIC)。4K随机读取吞吐量为2,453K IOPS,平均延迟为5.36 ms,而4K随机写入吞吐量为500K IOPS,平均延迟为12.79 ms。

其实自从Ceph Giant发布以来,英特尔一直与社区,生态系统和合作伙伴密切合作,一直优化Ceph的性能。下图显示了Ceph主要版本和不同Intel平台上4K随机写入工作负载的性能优化历史记录。

凭借新的Ceph主要版本,后端存储,结合核心平台变化和SSD升级,单个节点的4K随机写入性能提高了27倍(每个节点每秒输入/输出操作3,673次(IOPS)至每个节点100,052 IOPS)!

这使得使用Ceph构建高性能存储解决方案成为可能。

在本文中,我们在英特尔至强可扩展处理器上看到了采用Ceph AFA参考架构的英特尔Optane技术的性能结果。此配置展示了出色的吞吐量和延迟,除了延迟比传统的高端存储有些差距外,带宽和IOPS都达到了高端存储的水平。

对于读取密集型工作负载,尤其是小块读,对CPU性能要求比较高,建议使用英特尔至强可扩展处理器系列的顶级处理器,例如英特尔至强铂金8000系列处理器。

与采用英特尔至强可扩展处理器上的Ceph AFA集群的默认配置的英特尔Optane技术相比,软件调优和优化还为读取和写入提供了高达19%的性能提升。

由于使用当前的硬件配置可以观察到硬件性能还有净空,因此性能有望在不久的将来通过持续的Ceph优化(如RDMA messenger,NVMe-focus对象存储,async-osd等)不断改进。

相信有了英特尔®至强®可扩展处理器和傲腾™技术的支持,加上Ceph不断优化,未来Ceph的性能将会更好,Ceph也将越来越多用于主存储场景,而不仅仅是目前聚焦的第二存储场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7514

    浏览量

    164017
  • Ceph
    +关注

    关注

    1

    文章

    22

    浏览量

    9418

原文标题:让Ceph存储的性能飙升的原因竟然是因为它?

文章出处:【微信号:TopStorage,微信公众号:存储加速器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    PCM2704的ROM编程好了,竟然是乱码,为什么?

    的说法将ROM编程好,接入系统,插入USB后,显示正在安装驱动,没想到安装完毕后竟然名称显示为乱码,百思不得其解。望各位大神帮我看看问题出在哪里 这是德州仪器官方数据表中关于ROM的三段重要描述 我按照说明编程如下 可是插入电脑后显示是乱码 求助大神,问题出在哪里?
    发表于 11-05 08:04

    远程升级频频失败?原因竟然是

    ​最近有客户反馈在乡村里频繁出现掉线的情况。 赶紧排查原因! 通过换货、换SIM卡对比排查测试,发现只有去年采购的那批模块在客户环境附近会出现掉线的情况,而今年采购的模块批次就不会掉线。。。 继续
    的头像 发表于 10-14 07:07 190次阅读
    远程升级频频失败?<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>…

    异常重启怎么破?多方排查后,原因竟然是。。。

    ​又是异常重启。。。人摸不到头脑。 这几天,看到客户上报了重启问题,说是查不出原因。 重启现象是 ——有极个别设备在工作中不定时反复异常重启,大部分设备正常;反复重启设备,有时候又能持续正常工作
    的头像 发表于 10-14 07:04 302次阅读
    异常重启怎么破?多方排查后,<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>。。。

    令人头疼的异常重启,竟然是KV的锅…

    合宙模组异常重启原因排查
    的头像 发表于 09-26 18:14 461次阅读
    令人头疼的异常重启,<b class='flag-5'>竟然是</b>KV的锅…

    必须要进行压力表校验的原因竟然是

    压力表
    华泰天科
    发布于 :2024年09月14日 09:37:57

    集成运放电路采用直接耦合方式是因为什么

    集成运放电路采用直接耦合方式的原因主要是由于其独特的优势和应用需求。直接耦合方式指的是在电路中不使用耦合电容,而是直接将一个放大级的输出连接到下一个放大级的输入。这种方式在集成运放电路中非
    的头像 发表于 09-03 09:17 1876次阅读

    谷景科普一体成型贴片电感很烫是因为短路吗

    谷景科普一体成型贴片电感很烫是因为短路吗 编辑:谷景电子 一体成型贴片电感对于电子电路运行的稳定性是特别重要的,在电路中它可以抵抗电流的变化并存储能量。但是,有时候在一些情况下会出现温度过高的现象
    的头像 发表于 08-16 09:18 328次阅读

    基于DPU的Ceph存储解决方案

    1. 方案背景和挑战 Ceph是一个高度可扩展、高性能的开源分布式存储系统,设计用于提供优秀的对象存储、块存储和文件
    的头像 发表于 07-15 13:44 1339次阅读
    基于DPU的<b class='flag-5'>Ceph</b><b class='flag-5'>存储</b>解决方案

    晶体为什么会老化?原因竟然是....

    晶体
    TROQ创捷电子
    发布于 :2024年06月25日 08:52:52

    手机出问题的元凶找到了!万万没想到,竟然是因为!#esd# 保护器件

    保护器件半导体元器件
    萨瑞微电子
    发布于 :2024年04月15日 16:07:27

    见证历史!SpaceX的PCB供应商竟然是

    北京时间3月14日晚,马斯克旗下太空探索技术公司(SpaceX)的星舰重型运载火箭第三次试飞成功进入太空。
    的头像 发表于 03-17 11:41 1866次阅读
    见证历史!SpaceX的PCB供应商<b class='flag-5'>竟然是</b><b class='flag-5'>它</b>

    使用tc397进行收发的时候没有响应是因为什么?

    在使用 tc397 进行收发的时候,发现没有响应,代码是根据示例代码修改,通过逻辑分析仪和示波器进行调试的 只修改了对应的 tx,rx 引脚,请问可能是因为什么原因
    发表于 03-05 07:45

    IBM积极推进Ceph扩展,以打造AI领域的底层数据存储基石

    BM正着手扩展Ceph的块和文件存储功能,希望将其定位为Storage Scale并行文件系统之下面向AI工作负载的后端数据存储
    发表于 02-20 16:15 410次阅读

    N9H20 GPIO上电竟然是高电平,有没有办法解决?

    一直很纳闷,GPIO上电竟然是高电平。有没有办法解决,是不是要改动启动程序才能解决问题?
    发表于 01-17 08:27

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 1556次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?