0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【服务器数据恢复】新网邮件服务器RAID5两块盘先后离线导致阵列崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2022-10-31 12:00 次阅读

服务器数据恢复环境:

新网企业邮件服务器;

组建RAID5,文件系统为REISERFS;

一个数据分区,存放上百万企业用户的邮件。

服务器故障&分析:

服务器在正常运行过程中,RAID突然OFFLINE。管理员检查发现故障服务器有两块盘报警,将其中一块盘强制上线后却发现卷无法挂载,于是执行FSCK并REBULD TREE,完成上述操作后卷仍然无法挂载。咨询多家数据恢复服务商均无法提供可行的解决方案,最终新网选择我们数据恢复中心进行数据恢复。

这种RAID故障在我们数据恢复中心接到的cases中是很常见的。因为报警的两块盘并不是同时掉线,如果强制上线先离线的硬盘会导致数据区的新旧数据混在一起,文件系统结构不一致。强制上线会在读写过程中生成新的检验条带,会影响一部分数据。如果读写不多或根本无法MOUNT,情况的严重性会小很多。

本案例中最严重的问题在于REBUILD TREE,此操作相当于将一个混杂的文件系统连续化,结果会导致文件系统的所有结构体全面出错,这种情况通常是无法挽救的。加上用户的文件目录结构非常复杂,文件总数粗略估计上亿,恢复数据的机会很小。

服务器数据恢复过程:

1、首先对故障服务器所有硬盘做镜像备份,后续的数据恢复操作都在备份文件上进行,避免对数据二次破坏。

2、服务器数据恢复工程师先试图将文件系统结构区单独提出来进行分析,但REISERFS文件系统区相对分散且无规律,通过北亚自主研发的程序对文件系统结构区进行提取和分析。在本案例中,仅1级节点提取出来的数据就有好几个G,可见本案例文件结构的复杂。

3、对文件系统区进行一致性检验,修正错误地方。本案例中好多文件系统节点区都因检验关系,使关键属性字节发生了改变。通过北亚自主研发的程序将所有节点状态统一初始化,对节点进行一致性处理。

4、完成上述两步操作后有2种方案恢复最终的数据:

第一种方案:在LINUX系统下再次执行FSCK,结果实施这种方案后发现效果不好,原因是LINUX FSCK的功能有限,如果在父节点稍有错误,其子节点便会被全部打入到LOST+FOUND里,无法还原原本的目录结构。

第二种方案:通过只读方式,在WINDOWS环境下用北亚自主研发的程序提取数据。在具体的实施过程中,需要不断修改程序并忽略一些错误,最终提取出数据。

5、由用户对恢复出来的数据进行检测,确认需要的数据基本都恢复出来,可以正常读取。

服务器数据恢复总结:

RAID5磁盘阵列两块硬盘先后离线,但是又不知道离线先后顺序的case很多。碰到这种情况需要我们谨慎处理。如果可以查询到日志,通过日志确定为好。如果强制上线出错,应马上停止操作,切不可做FSCK等操作。

LINUX的FSCK操作风险很大,做之前一定要看清楚提示,如果出错信息异常,应选择其他方案。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8343

    浏览量

    83496
  • RAID
    +关注

    关注

    0

    文章

    254

    浏览量

    34931
  • 数据恢复
    +关注

    关注

    10

    文章

    461

    浏览量

    16993
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃数据恢复案例

    管理,存放的数据主要为Oracle数据库及OA服务端。 服务器存储故障: 服务器存储raid5
    的头像 发表于 06-12 11:30 94次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—磁盘不稳定被踢<b class='flag-5'>导致</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—磁盘离线但热备盘未完全启用导致raid5阵列崩溃数据恢复案例

    一台EMC某型号存储由于存储中raid5阵列出现故障导致服务器崩溃,由于数据涉密,需要工程师到现
    的头像 发表于 06-11 13:51 87次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—磁盘<b class='flag-5'>离线</b>但热备盘未完全启用<b class='flag-5'>导致</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列磁盘离线后强制上线导致数据丢失的数据恢复案例

    阵列后发现raid5阵列中有两块硬盘离线,将其中一块硬盘进行强制上线操作,但是服务器操作系统启动
    的头像 发表于 06-07 14:38 188次阅读

    服务器数据恢复raid5阵列硬盘离线且热备盘未激活的数据恢复案例

    raid5阵列两块硬盘由于未知故障离线服务器数据丢失。北亚企安
    的头像 发表于 06-06 17:07 205次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>硬盘<b class='flag-5'>离线</b>且热备盘未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    一台某品牌X3650M3服务器服务器中有一组raid5磁盘阵列,上层采用zfs文件系统。 服务器未知原因
    的头像 发表于 06-04 11:08 193次阅读

    服务器数据恢复RAID5阵列两块盘出现物理故障离线数据恢复案例

    服务器中有一组由多块硬盘组建的raid5磁盘阵列服务器阵列中2块硬盘先后掉线
    的头像 发表于 05-09 14:02 115次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b><b class='flag-5'>两块</b>盘出现物理故障<b class='flag-5'>离线</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—StorNext文件系统下raid5数据恢复案例

    ,划分2个存储系统。 服务器故障: 数据存储的1个存储系统中的一组RAID5阵列中有2块硬盘先后出现故障
    的头像 发表于 04-22 14:51 198次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—StorNext文件系统下<b class='flag-5'>raid5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—分享几个服务器数据恢复的案例

    服务器数据恢复案例之服务器raid6中3个磁盘离线导致
    的头像 发表于 03-04 13:21 431次阅读

    服务器数据恢复Raid5硬盘离线导致热备盘上线同步失败的数据恢复案例

    服务器数据恢复环境: 两组由4块磁盘组建的raid5磁盘阵列,两组raid5
    的头像 发表于 01-08 13:38 184次阅读

    服务器数据恢复-raid5故障导致上层卷无法挂载的数据恢复案例

    raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正
    的头像 发表于 12-14 11:32 325次阅读

    服务器数据恢复raid5热备盘未激活导致阵列崩溃数据恢复案例

    (oracle已经不再为该OA系统提供后续服务支持)。 服务器故障: raid5中一块磁盘离线,热备盘未自动激活rebuild(原因不明)。
    的头像 发表于 12-12 13:58 277次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>热备盘未激活<b class='flag-5'>导致</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复- 服务器RAID5热备盘未激活的数据恢复案例

    服务器故障&初检: RAID5中一块磁盘离线后热备盘未自动激活rebuild,之后另外一块磁盘离线RAID5
    的头像 发表于 08-31 14:43 345次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>- <b class='flag-5'>服务器</b><b class='flag-5'>RAID5</b>热备盘未激活的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-服务器RAID6三块磁盘离线数据恢复案例

    服务器中有一组由6块磁盘组建的RAID6磁盘阵列服务器作为WEB服务器使用,上面运行了MYSQL数据
    的头像 发表于 08-25 14:18 410次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>-<b class='flag-5'>服务器</b><b class='flag-5'>RAID</b>6三块磁盘<b class='flag-5'>离线</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-Linux服务器RAID5数据恢复案例

    服务器数据恢复环境: 一台Linux Redhat操作系统服务器上有一组由5块硬盘组建的raid5阵列
    的头像 发表于 07-24 17:09 403次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>-Linux<b class='flag-5'>服务器</b><b class='flag-5'>RAID5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    IBM服务器RAID5阵列数据恢复案例

    Server数据库,第三个分区存放备份文件。 服务器故障: 服务器在运行过程中崩溃raid
    的头像 发表于 07-05 16:03 477次阅读