0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

固态硬盘内RAID5技术

VIBT_dputech 来源:大普微 作者:大普微 2020-09-25 17:24 次阅读

提到冗余保护,最容易想到的就是RAID(Redundant Arrays of Independent Disks)。它是一种把多块独立的物理硬盘按不同方式组合形成一个硬盘组,以此提供比单个硬盘更高的存储性能和数据冗余的技术。该技术在服务器和存储阵列产品中广泛应用。

近年来,随着固态硬盘的使用率上升,提升固态硬盘的性能和可靠性(包括寿命)一直是行业攻关的重点。RAID技术在固态硬盘内已经得到了广泛应用。关键数据多副本,可以看作是RAID1保护,用户数据更常见的则是使用性价比较高的RAID5。具体使用什么RAID级别,一般是根据实际情况进行选择。DapuStor的HaiShen系列产品就使用RAID5技术为用户数据提供冗余保护,提升可靠性。这里,我们就将盘内RAID5技术做一个简单介绍。

RAID5原理

数据按条带分布在不同位置,比如图中A1~Ap是一个条带,B1~Bp是另一个条带,每个条带中的一份数据(比如A1)叫做条带单元。每个条带有一份校验数据(比如Ap),所以我们一般也称它为N+1的RAID组。RAID5校验计算通常采用异或(XOR)算法。现在很多主控也提供RAID5计算的硬件加速功能。

盘内RAID5条带布局

为了保证任意时候,一个Block或者DIE损坏,不会导致数据丢失。一个RAID5条带中的每个条带单元最好是来自不同的Block和不同的DIE。这种我们一般称为DIE级别的RAID冗余。跟上图对应,比如A1数据在DIE 1的某个Block,A2数据在DIE2的某个Block。最直观的组条带方式就是每个DIE各选一个Block,然后每个Block的相同Page组成一个条带。各个Block的Page组成RAID5条带有下面几种常见布局:

1)固定DIE的布局

在组成一个RAID组的Block中,使用一个固定DIE的Block存储校验(类似传统的RAID3),但是组成不同RAID组的Block可以不同。

2)旋转布局

组成一个RAID组的Block中,校验不固定在某个Block上,而是有规律的旋转变化(RAID5的旋转布局有多种方式,此处只列举了一种)。

不同的数据布局,会产生不同的盘内数据布局。最直观的,顺序写后,顺序读,各个DIE或者Block上的压力模型,在前面提到两种布局下是不同的。

RAID5数据恢复

如果Host 读某个Nand Page发生UNC(UNCorrectable)错误,这时RAID5恢复的原理是读这个条带内其他数据和校验数据,进行计算,得到期望的数据。

盘内RAID的异常处理

RAID5的数据恢复依赖分条的完整性,因为故障可能发生在任何阶段,所以数据恢复前必须判断出校验的有效性,避免恢复出错误数据。

典型场景1:某个Nand Block故障时,这个Block已经在一个写完成的条带上,此时RAID其实处于降级状态,较优的想法是把相关条带的数据重新放到一个健康的条带或者重建出故障Block的数据来替换它。

典型场景2:某个Nand Block 故障时,此时还没有数据写入,尽量把它从RAID组的Block中剔除,选一个健康的Block替换或者让当前RAID组从N+1保护转换成(N-1)+1。

典型场景3:一个条带单元的数据写入Nand 过程中发生了Program fail,同时另一个位置的读又遇到UNC,这些场景在DapuStor的HaiShen系列产品中都有专门处理,保障可以恢复出正确数据。

因为错误可能发生在任何时刻,所以其他场景这里就不一一列举。

RAID带来的影响

1.OP(Over Provisioning)空间降低

引入RAID后,有的Nand空间用于存储校验数据,间接导致用户数据的可用OP空间降低,

2.WA(Write Amplification)变大

因为每个条带额外写入了一份校验数据,所以整个生命周期的WA会增大。

3.性能影响

前面两点提到的OP变小,写放大变大,其实最终也都会表现成对性能的影响。另外,一个直观感受是顺序写和读的过程,因为每个条带都有一个DIE没有提供给Host IO服务,所以性能也必定会有影响。

盘内冗余技术发展

RAID5为用户数据提供了N+1级别的冗余保护。随着盘内功能增强,业务对盘内可靠性要求的提高,不同成本和可靠性定位的用户可能会需要不同冗余保护的级别。技术上还有一些更高级别的冗余保护:

1.RAID6

相比RAID5的N+1,它提供了N+2的保护。对应在SSD产品中,它当然也会带来更大的OP损耗。

2.EC(Erasure Coding)

现在分布式存储时代,多备份和EC相比传统RAID是更广泛的应用。EC算法提供了N+M的保护级别,可以有更广阔的选择空间。

原文标题:盘内数据冗余保护

文章出处:【微信公众号:大普微】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 固态硬盘
    +关注

    关注

    12

    文章

    1452

    浏览量

    57264

原文标题:盘内数据冗余保护

文章出处:【微信号:dputech,微信公众号:DapuStor】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    服务器数据恢复—用5RAID5阵列中的4块盘重建RAID5阵列后如何恢复原始数据?

    服务器数据恢复环境: 一台服务器挂接一台存储,该存储中有一组由5硬盘组建的RAID5阵列。 服务器故障: 存储raid5阵列中有一块硬盘
    的头像 发表于 10-30 15:07 144次阅读

    RAID5数据恢复—如何重组RAID5阵列?

    RAID5数据恢复环境: 一台存储上有一组由12块SCSI硬盘(11块数据盘+1块热备盘)组建的RAID5磁盘阵列,FreeBSD操作系统+zfs文件系统。 RAID5故障: 其
    的头像 发表于 10-22 15:48 184次阅读
    <b class='flag-5'>RAID5</b>数据恢复—如何重组<b class='flag-5'>RAID5</b>阵列?

    服务器数据恢复—Raid5阵列两块硬盘指示灯亮黄色的数据恢复案例

    服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块
    的头像 发表于 10-10 13:48 138次阅读
    服务器数据恢复—<b class='flag-5'>Raid5</b>阵列两块<b class='flag-5'>硬盘</b>指示灯亮黄色的数据恢复案例

    服务器数据恢复—5RAID5阵列重建4盘raid5阵列如何恢复原raid5数据?

    一台服务器,有一组由5硬盘组建的raid5磁盘阵列。 服务器在运行过程中一块有磁盘掉线,由于raid5阵列支持一块磁盘掉线的特性,服务器还在正常工作。不久之后服务器出现故障,管理员
    的头像 发表于 07-16 13:49 350次阅读
    服务器数据恢复—<b class='flag-5'>5</b>盘<b class='flag-5'>RAID5</b>阵列重建4盘<b class='flag-5'>raid5</b>阵列如何恢复原<b class='flag-5'>raid5</b>数据?

    服务器数据恢复—EMC存储中raid5阵列多块硬盘离线的数据恢复案例

    突然崩溃。管理员检查发现存储中的raid5阵列有两块硬盘离线,该阵列中的两块热备盘只有一块热备盘激活成功,raid5阵列瘫痪,存储不可用。
    的头像 发表于 07-09 11:58 201次阅读

    服务器数据恢复—raid5阵列硬盘坏道导致raid崩溃的数据恢复案例

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块硬盘组建2组RAID5磁盘阵列(一组raid5阵列有27块成员盘,存放Oracle数据库文件;另外一组
    的头像 发表于 07-05 12:00 493次阅读

    服务器数据恢复—raid5热备盘同步过程中硬盘离线的数据恢复案例

    某品牌DS5300存储,包含一个存储机头和多个磁盘柜,组建了多组RAID5磁盘阵列。 某个磁盘柜中的一组RAID5阵列由15块数据盘和1块热备硬盘组建。该磁盘柜中的某块硬盘离线,热备
    的头像 发表于 06-20 11:13 238次阅读

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    的数据丢失。 数据恢复工程师在现场对故障服务器raid5阵列中的磁盘进行硬件故障检测,经过检测发现该raid5阵列中离线的两块硬盘均无硬件问题。
    的头像 发表于 06-04 11:08 492次阅读

    服务器数据恢复—RAID5阵列硬盘报警亮黄灯的数据恢复案例

    服务器数据恢复环境: 某品牌P2000服务器,有一组由数块硬盘组建的raid5磁盘阵列(有热备盘),部署了VMWARE ESX虚拟化平台,VMFS文件系统。 服务器故障: 服务器在正常运行
    的头像 发表于 05-30 11:43 1023次阅读
    服务器数据恢复—<b class='flag-5'>RAID5</b>阵列<b class='flag-5'>硬盘</b>报警亮黄灯的数据恢复案例

    服务器数据恢复—不同型号服务器的RAID5数据恢复策略

    RAID5作为应用最广泛的raid阵列级别之一,在不同型号服务器中的RAID5出现故障后,处理方法也不同。 RAID5阵列级别是无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存
    的头像 发表于 04-12 14:51 330次阅读

    raid5热备盘同步过程中磁盘离线导致同步失败的数据恢复案例

    一台存储上有一组由多块硬盘组建的raid5阵列,该raid5阵列中的一块硬盘掉线,热备盘自动上线同步数据的过程中,raid阵列中又有一块
    的头像 发表于 03-14 15:47 337次阅读

    服务器数据恢复—华为OceanStor存储raid5数据恢复案例

    服务器数据恢复环境: 华为OceanStor某型号存储,存储内有一组由24块硬盘组建的raid5阵列,配置1块热备盘。 服务器故障: 该存储raid5阵列中有一块硬盘离线,热
    的头像 发表于 01-18 11:58 430次阅读
    服务器数据恢复—华为OceanStor存储<b class='flag-5'>raid5</b>数据恢复案例

    【服务器数据恢复】Raid5硬盘离线导致热备盘上线同步失败的数据恢复案例

    服务器数据恢复环境: 两组由4块磁盘组建的raid5磁盘阵列,两组raid5阵列划分为lun并组成了lvm结构,ext3文件系统。 服务器故障: 一组raid5阵列中的一块硬盘
    的头像 发表于 01-08 13:38 293次阅读

    服务器数据恢复—Raid5部分磁盘重建新raid5如何恢复原raid数据?

    一台服务器上搭建了一组由5硬盘组建的raid5阵列,服务器上层存放单位重要数据,无备份文件。
    的头像 发表于 12-11 13:20 833次阅读

    服务器数据恢复—EMC存储raid5故障的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储,8块组建一组raid5磁盘阵列。上层操作系统采用zfs文件系统。 服务器存储故障&分析: raid5阵列中有2块硬盘未知原因离线,raid
    的头像 发表于 11-30 11:59 552次阅读