服务器数据恢复—raid5热备盘未激活导致阵列崩溃的数据恢复案例-电子发烧友网

服务器数据恢复环境：
某品牌X系列服务器，4块SAS硬盘组建了一组RAID5阵列，还有1块磁盘作为热备盘使用。服务器上层安装的linux 操作系统，操作系统上部署了一个基于or acle数据库的OA（oracle已经不再为该OA系统提供后续服务支持）。

服务器故障：
raid5中一块磁盘离线，热备盘未自动激活rebuild（原因不明）。服务器在运行一段时间后，另一块磁盘离线，RAID5阵列崩溃。用户方要求尽可能恢复服务器操作系统和服务器中的数据。
将故障服务器中所有磁盘编号后取出，硬件工程师检测后没有发现有磁盘（包括离线的2块磁盘和热备盘）存在明显的物理故障。热备盘完全没有启用，无明显同步表现。

服务器数据恢复方案：
1、将所有磁盘以只读方式进行扇区级的全盘镜像，镜像完成后将所有磁盘按照编号还原到原服务器中，后续的数据分析和数据恢复操作都基于镜像文件进行，避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析RAID5结构，获取到RAID5条带规则、条带大小、校验方向、META区域等raid结构相关信息。
3、根据获取到的RAID结构信息虚拟重构RAID5。
4、解释虚拟磁盘及文件系统。
5、检测重构的raid5结构是否正确，如不正确，重复2-4过程。
6、检测raid5结构没有问题以及数据无误后，按用户要求回迁数据。

服务器数据恢复过程：
1、在对故障服务器中磁盘做镜像时，发现后离线的那块磁盘有十几个坏扇区，其余磁盘没有发现有坏道。
2、基于镜像文件分析获取raid5结构相关信息。

北亚企安数据恢复——Raid5数据恢复

3、根据获取到的raid结构信息虚拟重组raid5，重组完成后验证数据，发现200M以上的压缩包解压没有报错，由此可以确定分析出来的raid5结构正确。
4、按照该raid5结构生成虚拟RAID到一块单硬盘上，打开文件系统没有出现报错。
5、确定备份包没有问题和经过用户方的同意后，用新硬盘更换存在坏扇区的那块磁盘，然后对原盘重建RAID。
6、将恢复好的单盘用USB方式接入故障服务器，用linux SystemRescueCd启动故障服务器，然后使用dd命令进行全盘回写。
7、dd所有数据后，启动操作系统，无法进入操作系统桌面并出现报错，报错信息为：“/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied”，北亚企安数据恢复工程师初步判断此文件权限有问题。用SystemRescueCd重启后检查，发现此文件时间、权限、大小均有明显错误，很显然节点损坏。
8、重新分析重组数据中的根分区，定位出错的/sbin/pidof/，发现出错是由磁盘坏道导致的。
9、北亚企安数据恢复工程师使用3块完好的磁盘对后离线、存在坏道的那块磁盘的损坏区域进行xor补齐。补齐后重新校验文件系统依然有错误。再次检查inode表，发现后离线、存在坏道的磁盘的损坏区域有部分节点表现为(55 55 55部分)：

北亚企安数据恢复——Raid5数据恢复

很明显，虽然节点中描述的uid正常存在，但属性、大小、最初的分配块全部是错误的。北亚企安数据恢复工程师按照所有可能性进行分析，确定无法找回此损坏节点。只能修复此节点或者复制一个相同的文件过来。
10、针对所有可能有错的文件，通过日志确定原节点块的节点信息，再做修正。
11、修正后重新dd根分区，执行fsck -fn /dev/sda5/进行检测，依然报错。

北亚企安数据恢复——Raid5数据恢复

12、根据报错提示，在系统中发现有多个节点共用同样的数据块。按照提示分析底层，发现存在节点信息的新旧交集。
13、按节点所属的文件进行区别，清除错误节点后，再次执行fsck -fn /dev/sda5进行检测，依然有极少量的报错信息。根据报错提示，发现这些节点多位于doc目录下，不影响系统启动。直接执行fsck -fy /dev/sda5/强行修复。
14、修复完成后重启系统，成功进入操作系统桌面。
15、启动oracle数据库服务，启动应用软件，一切正常，无报错。
16、用户方对操作系统，oracle数据库以及OA数据进行检测，经过多部门的反复检测，确认恢复数据完整可用。本次数据恢复工作完成。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

服务器

服务器

+关注

关注
12

文章
9123

浏览量
85318
数据恢复

数据恢复

+关注

关注
10

文章
568

浏览量
17431
RAID5

RAID5

+关注

关注
0

文章
113

浏览量
12720

服务器数据恢复—RAID5阵列两块硬盘离线崩溃，数据如何起死回生？

服务器数据恢复环境：两组分别由4块SAS接口硬盘组建的raid5阵列，两组raid5

发表于 12-11 13:17 •140次阅读

<b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>阵列</b>两块硬盘离线<b class='flag-5'>崩溃</b>，<b class='flag-5'>数据</b>如何起死回生？

服务器数据恢复—RAID5阵列热备盘同步数据失败的数据恢复案例

服务器存储数据恢复环境：华为S5300存储中有12块FC硬盘，其中11块硬盘作为数据盘组建了一组RA

发表于 12-04 16:02 •190次阅读

服务器数据恢复—raid5阵列崩溃导致上层lun无法正常使用的数据恢复案例

服务器存储数据恢复环境：某品牌MSA2000FC存储中有一组由7块盘组建的RAID5阵列，另

发表于 11-25 14:04 •119次阅读

服务器数据恢复—RAID5阵列硬盘离线但热备盘未激活的数据恢复案例

。 服务器故障：这组raid5阵列中一块磁盘离线，但是热备盘并没有自动

发表于 10-15 10:33 •283次阅读

服务器数据恢复—raid5阵列热备盘上线同步失败的数据恢复案例

服务器磁盘阵列数据恢复环境： 服务器中有两组分别由4块SAS硬盘组建的raid5磁盘

发表于 09-19 11:01 •279次阅读

服务器数据恢复—raid5阵列热备盘未全部成功启用的数据恢复案例

服务器存储数据恢复环境：一台EMC某型号存储中有一组RAID5磁盘阵列。该raid5

发表于 08-14 11:27 •383次阅读

服务器数据恢复—raid5阵列热备盘同步失败的数据恢复案例

服务器存储数据恢复环境：华为S5300存储中有一组由16块FC硬盘组建的RAID5磁盘阵列（包含一块

发表于 07-15 11:38 •508次阅读

服务器数据恢复—raid5阵列热备盘未完全激活导致阵列崩溃的数据恢复案例

服务器存储数据恢复环境：北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的raid5磁盘

发表于 07-12 10:58 •316次阅读

服务器数据恢复—EMC存储中raid5阵列多块硬盘离线的数据恢复案例

服务器存储数据恢复环境：一台EMC存储中有一组raid5磁盘阵列，划分1个lun供小型机使用，上层采用ZFS文件系统。

发表于 07-09 11:58 •220次阅读

服务器数据恢复—raid5阵列硬盘坏道导致raid崩溃的数据恢复案例

服务器存储数据恢复环境：某单位一台某品牌DS5300存储，1个机头+4个扩展柜，50块硬盘组建2组RAID5磁盘阵列（一组

发表于 07-05 12:00 •544次阅读

服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃的数据恢复案例

服务器存储数据恢复环境：某品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的raid5磁盘阵

发表于 06-12 11:30 •302次阅读

服务器数据恢复—raid5阵列硬盘离线且热备盘未激活的数据恢复案例

raid5阵列中两块硬盘由于未知故障离线，服务器数据丢失。北亚企安数据恢复中心安排

发表于 06-06 17:07 •395次阅读

服务器数据恢复—RAID5多块磁盘掉线导致崩溃的数据恢复案例

某公司的一台服务器中的raid5磁盘阵列有两块磁盘先后掉线，服务器崩溃。故障服务器的操作系统为l

发表于 05-21 11:43 •759次阅读

服务器数据恢复—华为OceanStor存储raid5数据恢复案例

服务器数据恢复环境：华为OceanStor某型号存储，存储内有一组由24块硬盘组建的raid5阵列，配置1块

发表于 01-18 11:58 •449次阅读

【服务器数据恢复】Raid5硬盘离线导致热备盘上线同步失败的数据恢复案例

服务器数据恢复环境：两组由4块磁盘组建的raid5磁盘阵列，两组raid5

发表于 01-08 13:38 •307次阅读