0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【服务器数据恢复】新网邮件服务器RAID5两块盘先后离线导致阵列崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2022-10-31 12:00 次阅读

服务器数据恢复环境:

新网企业邮件服务器;

组建RAID5,文件系统为REISERFS;

一个数据分区,存放上百万企业用户的邮件。

服务器故障&分析:

服务器在正常运行过程中,RAID突然OFFLINE。管理员检查发现故障服务器有两块盘报警,将其中一块盘强制上线后却发现卷无法挂载,于是执行FSCK并REBULD TREE,完成上述操作后卷仍然无法挂载。咨询多家数据恢复服务商均无法提供可行的解决方案,最终新网选择我们数据恢复中心进行数据恢复。

这种RAID故障在我们数据恢复中心接到的cases中是很常见的。因为报警的两块盘并不是同时掉线,如果强制上线先离线的硬盘会导致数据区的新旧数据混在一起,文件系统结构不一致。强制上线会在读写过程中生成新的检验条带,会影响一部分数据。如果读写不多或根本无法MOUNT,情况的严重性会小很多。

本案例中最严重的问题在于REBUILD TREE,此操作相当于将一个混杂的文件系统连续化,结果会导致文件系统的所有结构体全面出错,这种情况通常是无法挽救的。加上用户的文件目录结构非常复杂,文件总数粗略估计上亿,恢复数据的机会很小。

服务器数据恢复过程:

1、首先对故障服务器所有硬盘做镜像备份,后续的数据恢复操作都在备份文件上进行,避免对数据二次破坏。

2、服务器数据恢复工程师先试图将文件系统结构区单独提出来进行分析,但REISERFS文件系统区相对分散且无规律,通过北亚自主研发的程序对文件系统结构区进行提取和分析。在本案例中,仅1级节点提取出来的数据就有好几个G,可见本案例文件结构的复杂。

3、对文件系统区进行一致性检验,修正错误地方。本案例中好多文件系统节点区都因检验关系,使关键属性字节发生了改变。通过北亚自主研发的程序将所有节点状态统一初始化,对节点进行一致性处理。

4、完成上述两步操作后有2种方案恢复最终的数据:

第一种方案:在LINUX系统下再次执行FSCK,结果实施这种方案后发现效果不好,原因是LINUX FSCK的功能有限,如果在父节点稍有错误,其子节点便会被全部打入到LOST+FOUND里,无法还原原本的目录结构。

第二种方案:通过只读方式,在WINDOWS环境下用北亚自主研发的程序提取数据。在具体的实施过程中,需要不断修改程序并忽略一些错误,最终提取出数据。

5、由用户对恢复出来的数据进行检测,确认需要的数据基本都恢复出来,可以正常读取。

服务器数据恢复总结:

RAID5磁盘阵列两块硬盘先后离线,但是又不知道离线先后顺序的case很多。碰到这种情况需要我们谨慎处理。如果可以查询到日志,通过日志确定为好。如果强制上线出错,应马上停止操作,切不可做FSCK等操作。

LINUX的FSCK操作风险很大,做之前一定要看清楚提示,如果出错信息异常,应选择其他方案。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8921

    浏览量

    85030
  • RAID
    +关注

    关注

    0

    文章

    267

    浏览量

    35028
  • 数据恢复
    +关注

    关注

    10

    文章

    533

    浏览量

    17333
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复RAID5阵列硬盘离线但热备未激活的数据恢复案例

    服务器故障: 这组raid5阵列中一磁盘离线,但是热备并没有自动激活rebuil
    的头像 发表于 10-15 10:33 137次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b>硬盘<b class='flag-5'>离线</b>但热备<b class='flag-5'>盘</b>未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复Raid5阵列两块硬盘指示灯亮黄色的数据恢复案例

    服务器数据恢复环境: 一台某品牌存储设备上有一组由10硬盘(9数据
    的头像 发表于 10-10 13:48 112次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>Raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>两块</b>硬盘指示灯亮黄色的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘上线同步失败的数据恢复案例

    服务器磁盘阵列数据恢复环境: 服务器中有组分别由4
    的头像 发表于 09-19 11:01 202次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘上线同步失败的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备未完全激活导致阵列崩溃数据恢复案例

    服务器存储数据恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12成员raid5
    的头像 发表于 07-12 10:58 267次阅读

    服务器数据恢复—EMC存储中raid5阵列硬盘离线数据恢复案例

    突然崩溃。管理员检查发现存储中的raid5阵列两块硬盘离线,该阵列中的
    的头像 发表于 07-09 11:58 179次阅读

    服务器数据恢复raid5阵列硬盘坏道导致raid崩溃数据恢复案例

    服务器存储数据恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50硬盘组建2组RAID5磁盘
    的头像 发表于 07-05 12:00 427次阅读

    服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃数据恢复案例

    管理,存放的数据主要为Oracle数据库及OA服务端。 服务器存储故障: 服务器存储raid5
    的头像 发表于 06-12 11:30 256次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—磁盘不稳定被踢<b class='flag-5'>导致</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列硬盘离线且热备未激活的数据恢复案例

    raid5阵列两块硬盘由于未知故障离线服务器数据丢失。北亚企安
    的头像 发表于 06-06 17:07 348次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>硬盘<b class='flag-5'>离线</b>且热备<b class='flag-5'>盘</b>未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    一台某品牌X3650M3服务器服务器中有一组raid5磁盘阵列,上层采用zfs文件系统。 服务器未知原因
    的头像 发表于 06-04 11:08 455次阅读

    服务器数据恢复RAID5磁盘掉线导致崩溃数据恢复案例

    某公司的一台服务器中的raid5磁盘阵列两块磁盘先后掉线,服务器
    的头像 发表于 05-21 11:43 657次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b>多<b class='flag-5'>块</b>磁盘掉线<b class='flag-5'>导致</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5阵列两块出现物理故障离线数据恢复案例

    服务器中有一组由多硬盘组建的raid5磁盘阵列服务器阵列中2
    的头像 发表于 05-09 14:02 214次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b><b class='flag-5'>两块</b><b class='flag-5'>盘</b>出现物理故障<b class='flag-5'>离线</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—分享几个服务器数据恢复的案例

    服务器数据恢复案例之服务器raid6中3个磁盘离线导致
    的头像 发表于 03-04 13:21 1021次阅读

    服务器数据恢复—华为OceanStor存储raid5数据恢复案例

    服务器数据恢复环境: 华为OceanStor某型号存储,存储内有一组由24硬盘组建的raid5阵列
    的头像 发表于 01-18 11:58 413次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—华为OceanStor存储<b class='flag-5'>raid5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-raid5故障导致上层卷无法挂载的数据恢复案例

    raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正
    的头像 发表于 12-14 11:32 466次阅读

    服务器数据恢复raid5热备未激活导致阵列崩溃数据恢复案例

    (oracle已经不再为该OA系统提供后续服务支持)。 服务器故障: raid5中一磁盘离线,热备
    的头像 发表于 12-12 13:58 464次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>热备<b class='flag-5'>盘</b>未激活<b class='flag-5'>导致</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例