鲲鹏BoostKit 2.0分布式存储全局缓存如何加速数据存储倍数级-电子发烧友网

在华为全联接2021上，鲲鹏应用使能套件BoostKit（以下简称“鲲鹏BoostKit”）正式升级为2.0，提供 “数据亲和”加速组件，对数据全处理流程进行负载优化，从而大幅提升应用性能。本期由华为计算产品线算法专家陈泽晖和何智文向大家展示鲲鹏BoostKit 2.0分布式存储全局缓存（Global Cache）特性如何做到数据存储和处理的倍数级加速能力。

在摩尔定律的驱使下，计算能力倍数级增长，但数据传输速度过慢导致大量计算资源浪费，也限制了系统性能发挥。例如，在金融行业，银行逐步采用AI技术对客户信息、远程开户录像、客服中心语音、企业资料等数据进行挖掘与利用，对海量文件的读写会占用大量计算资源，导致业务处理效率降低。

原生Ceph IO请求的处理路径长，导致IO时延高，用户数据读写时间长

鲲鹏BoostKit分布式存储全局缓存应运而生，通过缓存前后台分离、IO聚合、智能预取三大创新技术实现典型读写场景IOPS提升10倍，IO时延降低90%，意味着同样时间内银行处理的交易笔数提升10倍，而且每笔交易处理时长降低90%！

测试模型：4K IO，7:3混合随机读写；硬件配置：256GB内存，25GE网络，每节点12 * 8TB SATA HDD，2 * 3.2TB NVMe SSD

下面带你1分钟get三大创新技术：

1. 缓存前后台分离——缩短数据处理路径：降低IO请求的线程数量，上层应用只需要将数据写入到缓存池或从缓存池中读取即可响应用户请求。

在数据写入场景，数据到写缓存后就可以给上层应用返回数据写入成功，无需与后台Ceph存储集群等分布式存储软件交互，用户业务应用无感知

2. 智能预取——读加速：将数据提前加载至读缓存，实现80%以上缓存命中率和2倍以上读性能加速。

基于IO数据统计，智能分析IO模型特征，实现缓存命中率大幅提升

3. IO聚合——写加速：技术通过批量数据聚合，实现全周期随机写入转顺序写入，实现满带宽性能。

在缓存中把各种大小的数据块聚合成以8M为单位的大数据块，从随机小IO转变成顺序大IO写入后端Ceph等分布式存储集群

此外，BoostKit全局缓存面向鲲鹏生态，结合硬件特点开展软硬协同优化，如CPU亲和、NUMA亲和等，进一步达到“数据亲和”，在不增加硬件成本的前提下，全局缓存面向全命中和真实业务负载提供2~10倍端到端读写性能加速能力。

原文标题：BoostKit干货店｜同样硬件，Ceph存储性能提升10倍

文章出处：【微信公众号：华为计算】欢迎添加关注！文章转载请注明出处。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

华为

华为

+关注

关注
216

文章
34417

浏览量
251530
数据存储

数据存储

+关注

关注
5

文章
970

浏览量
50897
ai技术

ai技术

+关注

关注
1

文章
1268

浏览量
24291

原文标题：BoostKit干货店｜同样硬件，Ceph存储性能提升10倍

文章出处：【微信号：gh_3a181fa836b6，微信公众号：华为计算】欢迎添加关注！文章转载请注明出处。

全国首座HPBC 2.0分布式光伏电站成功并网

近日，坐落于黑龙江省伊春市的龙飞木制品厂光伏电站成功并网，标志着全国首座HPBC 2.0分布式光伏电站建设完成，正式进入投运阶段。

发表于 12-05 15:39 •177次阅读

分布式存储费用高吗？大概需要多少钱

分布式存储的费用是否高，取决于多个因素，包括存储容量、性能要求、服务提供商、计费模式等。因此，无法简单地给出一个“高”或“不高”的答案。通常分布式存

发表于 09-24 10:41 •257次阅读

基于分布式存储系统医疗影像数据存储解决方案

基于分布式存储系统医疗影像数据存储解决方案

发表于 09-14 09:53 •305次阅读

基于分布式对象存储WDS的信托非结构化数据整合平台

基于分布式对象存储WDS的信托非结构化数据整合平台

发表于 08-28 09:56 •329次阅读

医疗PACS影像数据的极速分布式块存储解决方案

医疗PACS影像数据的极速分布式块存储解决方案

发表于 08-23 10:13 •322次阅读

基于分布式存储WDS的金融信创云承载数据库类关键应用

基于分布式存储WDS的金融信创云承载数据库类关键应用

发表于 08-16 09:42 •270次阅读

浪潮信息发布AS13000G7-N系列分布式全闪存储

浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统，结合新一代数据加速

发表于 05-14 10:03 •562次阅读

为大模型专门优化浪潮信息发布分布式全闪存储AS13000G7-N系列

北京2024年5月10日 /美通社/ -- 近日，浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据

发表于 05-10 16:37 •428次阅读

珠海万力达WLD-2610分布式DTU配电终端与阿普顿APT-6000分布式DTU对比

关于珠海万力达WLD-2610分布式DTU配电终端与阿普顿APT-6000分布式DTU配电终端区别大不？针对这个问题我把两家公司的产品说明书做了整理，从产品的简介、特点，主要功能等做个展示，希望广大用户们能一目了然，使用时更方便做出合适的选择！

发表于 05-10 15:52 •1094次阅读

大数据时代的存储革命：理解分布式存储系统

管理的效率极低。因此，分布式存储系统应运而生。 分布式存储就是将数据存储在众多的服务器或网络节点

发表于 03-07 15:40 •423次阅读

分布式存储与计算：大数据时代的解决方案

分布式存储和计算技术应运而生，并迅速成为处理大数据的首选方案。本文将深入探讨分布式存储和计算的概念、优势及其在各个领域的应用情况。 1.

发表于 03-07 14:42 •758次阅读

曙光存储推出ParaStor分布式全闪存储

曙光存储推出ParaStor分布式全闪存储，携业内首创技术XDS，以训练加速、稳定性强、性价比高的独特价值，全维度涵盖网络、计算和平台，为千行百业的AI大模型开发者提供

发表于 03-01 11:30 •609次阅读

AcrelCloud-1200分布式光伏运维云平台

AcrelCloud-1200分布式光伏运维云平台

发表于 01-26 08:07 •531次阅读

【Vsan数据恢复】Vsan分布式存储虚拟磁盘文件丢失的数据恢复案例

一套vsan分布式存储架构有数台服务器节点，该vsan分布式存储架构配置了固态硬盘和机械硬盘，固态硬盘作为缓存盘使用，机械硬盘作为容量盘使用

发表于 01-03 16:39 •617次阅读