0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—EMC存储RAID5阵列磁盘读写不稳定离线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-10-12 13:17 次阅读

服务器数据恢复环境:
一台EMC某型号存储设备,该存储中有一组由12块(包括2块热备盘)STAT硬盘组建的raid5阵列。

服务器故障:
该存储在运行过程中突然崩溃,raid瘫痪。数据恢复工程师到达现场对故障存储设备进行初检,发现raid中有两块硬盘掉线但只有一块热备盘成功激活,所以导致阵列瘫痪,上层lun无法使用。

服务器数据恢复过程:
1、将故障存储中所有磁盘标记后取出。由硬件工程师检测后没有发现有磁盘存在物理故障,使用坏道检测工具检测也没有发现有磁盘存在坏道。将所有磁盘以只读方式进行扇区级全盘镜像,由于源磁盘的扇区大小是520字节,做完镜像后将520字节转换成512字节。
2、由于故障存储中所有硬盘经过检测没有发现存在物理故障和坏道,基本上可以推断硬盘掉线是磁盘读写性能不稳定造成的。EMC控制器的磁盘检测策略十分严格,读写性能不稳定的磁盘一般会被控制器判定为坏盘并踢出raid。当raid中掉线盘超过该raid级别的允许掉盘数量的极限,raid就会崩溃,基于raid的lun不可用。本案例中只有一个lun分配给sun小机,上层文件系统是ZFS。
3、EMC存储的LUN都是基于RAID。通过分析发现有2块盘完全没有数据,EMC存储的管理界面上显示这2块没有数据的盘都是热备盘,其中一块热备盘替换了一块离线盘。虽然这块热备盘成功激活,RAID中还有一块硬盘离线,所以数据没有同步到这块热备盘中。继续分析其他10块盘,分析数据在硬盘中的分布规律、RAID条带大小以及盘序等重组RAID所需要的信息
4、由于RAID中有两块盘掉线,需要搞清楚这两块盘的掉线顺序。分析每一块盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的。通过北亚企安自主开发的RAID校验程序对这个条带做校验,最终确定这块硬盘就是最先掉线的。
5、根据上面步骤获取到的信息将RAID重组出来。EMC存储的LUN是基于RAID的。分析LUN在RAID中的分配信息,以及LUN分配的数据块MAP。根据上述信息,用北亚企安自主开发的程序解释LUN的数据MAP并导出LUN的所有数据。
6、用北亚企安自主开发的ZFS文件系统解释程序对生成的LUN做文件系统解释,但是在解释某些文件系统元文件的时候报错。开发工程师对程序做debug调试并分析程序报错原因,文件系统工程师分析ZFS文件系统是否因为版本原因而导致程序不支持。经过长达数小时的分析与调试,发现ZFS文件系统因存储瘫痪导致某些元文件损坏,从而导致文件系统解释报错。
7、北亚企安数据恢复工程师手工修复这些损坏的元文件,直到ZFS文件系统能够正常解析。
8、解析ZFS文件系统,解析所有文件节点及目录结构。用户方工程师对恢复出来的数据进行随机验证,经过仔细验证没有发现问题。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9287

    浏览量

    85847
  • 数据恢复
    +关注

    关注

    10

    文章

    585

    浏览量

    17578
  • emc
    emc
    +关注

    关注

    170

    文章

    3945

    浏览量

    183548
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复—华为OceanStor存储RAID5阵列数据恢复案例

    服务器存储数据恢复环境: 华为品牌型号为OceanStor S2600T的存储设备,存储上有一
    的头像 发表于 11-14 10:53 253次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—华为OceanStor<b class='flag-5'>存储</b>中<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5阵列硬盘离线但热备盘未激活的数据恢复案例

    服务器故障: 这组raid5阵列中一块磁盘离线,但是热备盘并没有自动激活rebuild,当另外一块
    的头像 发表于 10-15 10:33 327次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b>硬盘<b class='flag-5'>离线</b>但热备盘未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘上线同步失败的数据恢复案例

    服务器磁盘阵列数据恢复环境: 服务器中有两组分别由4块SAS硬盘组建的raid5
    的头像 发表于 09-19 11:01 318次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘上线同步失败的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—不当操作导致raid5阵列数据无法恢复的案例

    服务器数据恢复环境: 一台服务器中有一组由4块SCSI硬盘组建的raid5磁盘阵列,划分了一个
    的头像 发表于 08-28 13:39 301次阅读

    服务器数据恢复raid5阵列热备盘未全部成功启用的数据恢复案例

    服务器存储数据恢复环境: 一台EMC某型号存储中有一组RA
    的头像 发表于 08-14 11:27 421次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘未全部成功启用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘同步失败的数据恢复案例

    服务器存储数据恢复环境: 华为S5300存储中有一组由16块FC硬盘组建的RAID5
    的头像 发表于 07-15 11:38 555次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘同步失败的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘未完全激活导致阵列崩溃的数据恢复案例

    服务器存储数据恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的
    的头像 发表于 07-12 10:58 351次阅读

    服务器数据恢复EMC存储raid5阵列多块硬盘离线数据恢复案例

    服务器存储数据恢复环境: 一台EMC存储中有一组raid5
    的头像 发表于 07-09 11:58 256次阅读

    服务器数据恢复raid5阵列硬盘坏道导致raid崩溃的数据恢复案例

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块硬盘组建2组R
    的头像 发表于 07-05 12:00 591次阅读

    服务器数据恢复EMC存储中双循环riad5阵列数据恢复案例

    服务器存储数据恢复环境: EMC CX4-480存储,该
    的头像 发表于 06-18 11:10 487次阅读

    服务器数据恢复磁盘不稳定被踢导致raid5阵列崩溃的数据恢复案例

    服务器存储数据恢复环境: 某品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的
    的头像 发表于 06-12 11:30 345次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>磁盘</b><b class='flag-5'>不稳定</b>被踢导致<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列磁盘离线后强制上线导致数据丢失的数据恢复案例

    服务器数据恢复环境: 某品牌2850服务器中有一组由6块SCSI硬盘组建的raid5磁盘阵列
    的头像 发表于 06-07 14:38 413次阅读

    服务器数据恢复raid5阵列硬盘离线且热备盘未激活的数据恢复案例

    raid5阵列中两块硬盘由于未知故障离线服务器数据丢失。北亚企安数据
    的头像 发表于 06-06 17:07 436次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>硬盘<b class='flag-5'>离线</b>且热备盘未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    内的数据丢失。 数据恢复工程师在现场对故障服务器raid5阵列中的
    的头像 发表于 06-04 11:08 548次阅读

    服务器数据恢复—光纤存储raid5出现故障的数据恢复案例

    服务器数据恢复环境&故障情况: 某企业光纤存储上有一组由16块硬盘组建的raid5阵列。管理员
    的头像 发表于 04-10 15:38 483次阅读