0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—raid5阵列崩溃导致上层lun无法正常使用的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-11-25 14:04 次阅读

服务器存储数据恢复环境:
品牌MSA2000FC存储中有一组由7块盘组建的RAID5阵列,另外还有1块硬盘作为热备盘使用。
基于RAID5阵列划分的几个LUN分配给小机使用,存储空间通过LVM管理,重要数据为Oracle数据库及OA服务端。

服务器存储故障:
RAID5阵列中2块硬盘离线,唯一的热备盘成功激活,RAID5阵列还是变得不可用,上层LUN无法使用。

服务器存储数据恢复过程:
1、将故障存储中所有磁盘标记后取出,由硬件工程师对所有磁盘做物理故障检测,检测后没有发现有磁盘存在物理故障,都可以正常读取。以只读方式将所有磁盘进行扇区级全盘镜像,镜像过程中没有发现有磁盘存在坏道。

wKgaoWdEEuKANb_mAAFsIQ9lvYU381.png

北亚企安数据恢复—vxfs文件系统数据恢复



2、由于所有磁盘经过检测都不存在物理故障或者坏道,基本上可以判断磁盘掉线的是磁盘读写不稳定造成的。故障存储的控制器通常会将某些性能不稳定的磁盘识别为坏盘,并踢出RAID。而一旦RAID中掉线的盘数达到该RAID级别允许掉盘的极限,这个RAID将变得不可用,上层基于RAID的LUN也无法正常使用。
基于镜像文件分析所有磁盘底层数据,获取到重组raid所需信息(RAID级别,条带规则,条带大小,校验方向,META区域等)并找到热备盘和2块掉线硬盘的掉线顺序,然后根据这些信息重组RAID。
3、raid重组完成后分析LUN在RAID中的分配情况,以及LUN分配的数据块MAP,将每一个LUN的数据块分布MAP提取出来。北亚企安数据恢复工程师编写程序解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。

wKgZoWdEEu-ANnAaAAFlx_MnKsw081.png

北亚企安数据恢复—vxfs文件系统数据恢复



4、分析所有LUN,发现所有LUN中均包含LVM逻辑卷信息。尝试解析每个LUN中的LVM信息,一共发现三套LVM:第一个LVM中划分了一个LV,存放OA服务器端的数据;第二个LVM中也划分了一个LV,里面存放临时备份数据;剩下几个LUN组成一个LVM,也划分了一个LV,里面存放Oracle数据库文件。北亚企安数据恢复工程师编写解释LVM的程序,将每套LVM中的LV卷都解释出来,但是解释过程中出现错误。
5、分析程序报错的原因,由开发工程师debug程序出错的位置。文件系统工程师检测恢复出来的LUN,检测LVM逻辑卷的信息是否损坏。经过检测,发现LVM信息确实因为存储瘫痪而损坏。尝试人工修复损坏的区域,并同步修改程序,然后重新解析LVM逻辑卷。
6、搭建环境,将解释出来的逻辑卷映射到小机,并尝试挂载文件系统,结果文件系统挂载出错。尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,修复后还是无法挂载。数据恢复工程师怀疑vxfs文件系统的元数据被破坏,需要修复。
7、分析解析出来的LV,根据VXFS文件系统的底层结构校验此文件系统的完整性。经过分析发现底层VXFS文件系统果然有问题,部分文件系统元文件损坏。人工修复这些损坏的元文件,保证VXFS文件系统能够正常解析。将修复好的逻辑卷挂载到小机上,并尝试挂载文件系统。这回没有报错,成功挂载。
8、在小机上挂载上文件系统后,将所有用户数据备份至指定空间。

wKgZoWdEEviAYsa8AADfJF9t9-Y724.png

北亚企安数据恢复—vxfs文件系统数据恢复



9、使用Oracle数据库文件检测工具“dbv”检测每个数据库文件的完整性,没有发现错误。使用北亚企安自主开发的Oracle数据库检测工具检测,发现部分数据库文件和日志文件校验不一致。修复此类文件并再校验,直到所有文件校验均通过。
10、将恢复出来的Oracle数据库附加到原始生产环境的小机中,尝试启动Oracle数据库,Oracle数据库启动成功。

wKgZoWdEEwGAXzO2AAL6LnOCrM8524.png

北亚企安数据恢复—vxfs文件系统数据恢复



11、在用户方的配合下,启动Oracle数据库和OA服务端。在本地电脑上安装OA客户端,通过OA客户端验证最新的数据记录以及历史数据记录,并且安排不同部门工作人员进行远程验证。经过仔细验证,用户方确认数据完整可用,认可数据恢复结果。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9021

    浏览量

    85183
  • 数据恢复
    +关注

    关注

    10

    文章

    549

    浏览量

    17389
  • RAID5
    +关注

    关注

    0

    文章

    112

    浏览量

    12705
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复—双循环RAID5阵列崩溃数据如何恢复

    服务器存储数据恢复环境: 一台存储中有一组由7块硬盘组建的RAID5阵列,存储中还有另外3块盘是rai
    的头像 发表于 09-02 11:35 325次阅读

    服务器数据恢复raid5阵列热备盘同步失败的数据恢复案例

    服务器存储数据恢复环境: 华为S5300存储中有一组由16块FC硬盘组建的RAID5磁盘阵列(包含一块热备盘)。
    的头像 发表于 07-15 11:38 485次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘同步失败的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘未完全激活导致阵列崩溃数据恢复案例

    服务器存储数据恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的raid5磁盘阵列,其中包括2块热备盘。
    的头像 发表于 07-12 10:58 294次阅读

    服务器数据恢复—EMC存储中raid5阵列多块硬盘离线的数据恢复案例

    服务器存储数据恢复环境: 一台EMC存储中有一组raid5磁盘阵列,划分1个lun供小型机使用
    的头像 发表于 07-09 11:58 201次阅读

    服务器数据恢复raid5阵列硬盘坏道导致raid崩溃数据恢复案例

    raid5阵列有23块成员盘)。存储系统上层一共分了11个卷。 服务器存储故障: 磁盘故障导致27盘
    的头像 发表于 07-05 12:00 493次阅读

    服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃数据恢复案例

    管理,存放的数据主要为Oracle数据库及OA服务端。 服务器存储故障: 服务器存储raid5
    的头像 发表于 06-12 11:30 277次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—磁盘不稳定被踢<b class='flag-5'>导致</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—同友存储raid5阵列崩溃数据恢复案例

    服务器数据恢复环境: 某市教育局同友存储,存储中有一组由数块磁盘组建的raid5阵列,存储空间划分若干
    的头像 发表于 06-11 11:45 449次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—同友存储<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    一台某品牌X3650M3服务器服务器中有一组raid5磁盘阵列上层采用zfs文件系统。 服务器
    的头像 发表于 06-04 11:08 492次阅读

    服务器数据恢复—存储中raid5阵列多块磁盘离线导致lun不可用的数据恢复案例

    服务器存储数据恢复环境: 某品牌MSA2000存储,该存储中有一组由8块SAS硬盘(其中有一块热备盘)组建的RAID5阵列
    的头像 发表于 04-29 11:29 510次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—存储中<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>多块磁盘离线<b class='flag-5'>导致</b><b class='flag-5'>lun</b>不可用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复RAID5上层SAP+oracle数据恢复案例

    服务器存储数据恢复环境: 某品牌服务器存储中有一组由6块SAS硬盘组建的RAID5阵列,其中有
    的头像 发表于 04-15 16:52 372次阅读

    服务器数据恢复—华为OceanStor存储raid5数据恢复案例

    服务器数据恢复环境: 华为OceanStor某型号存储,存储内有一组由24块硬盘组建的raid5阵列,配置1块热备盘。
    的头像 发表于 01-18 11:58 430次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—华为OceanStor存储<b class='flag-5'>raid5</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5崩溃导致同友存储无法启动的数据恢复案例

    服务器数据恢复环境: 一台同友存储,存储上有一组raid5磁盘阵列,存储上层有若干台虚拟机,其
    的头像 发表于 01-02 13:28 332次阅读
    【<b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>raid5</b><b class='flag-5'>崩溃</b><b class='flag-5'>导致</b>同友存储<b class='flag-5'>无法</b>启动的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-raid5故障导致上层无法挂载的数据恢复案例

    raid5阵列中有两块硬盘出现故障掉线,导致服务器上层无法挂载,oracle
    的头像 发表于 12-14 11:32 497次阅读

    服务器数据恢复raid5热备盘未激活导致阵列崩溃数据恢复案例

    服务器数据恢复环境: 某品牌X系列服务器,4块SAS硬盘组建了一组RAID5阵列,还有1块磁盘
    的头像 发表于 12-12 13:58 488次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>热备盘未激活<b class='flag-5'>导致</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—EMC存储raid5故障的数据恢复案例

    服务器存储数据恢复环境: EMC某型号存储,8块组建一组raid5磁盘阵列上层操作系统采用z
    的头像 发表于 11-30 11:59 552次阅读