0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HP EVA存储硬盘读写不稳定离线的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2023-02-28 11:51 次阅读

服务器故障&检测&分析:

HP EVA存储设备中的RAID5磁盘有两块硬盘掉线,lun丢失。硬件工程师对故障服务器进行物理故障检测,发现掉线硬盘能够正常读取,无物理故障,也没有发现坏道。

故障服务器掉线硬盘没有物理故障,所以掉线极有可能是硬盘读写不稳定造成的。EVA控制会将读写不稳定的硬盘默认为坏盘并踢出。raid5冗余允许最大掉线硬盘的数量是2,掉线的硬盘超过了2块就会导致服务器崩溃。

通过分析故障服务器内raid条目的存储形式,发现每个硬盘的不同块组成一个raid条目。通过分析后解析出来raid条目信息,发现每个LUN都有一份LUN_MAP。由于EVA将LUN_MAP分别存放在不同的磁盘中,用一个索引来指定其位置,因此在磁盘中找出这个指定LUN_MAP位置的索引就可以找到现存LUN的信息。

服务器数据恢复过程:

1、将故障存储中所有硬盘连接到北亚企安数据恢复平台上,以只读方式将硬盘数据镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。

2、通过故障分析确定硬盘掉线的原因是读写不稳定,被控制器踢出掉线。这些掉线的硬盘中有一部分数据是老旧数据,LUN使用的是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值做比较就可以判断这个条目中是否有掉线盘。

将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中的哪些RAID条目中有掉线盘。在这些RAID条目中都存在的那个盘就一定就是掉线盘。排除掉线盘后根据LUN_MAP即可恢复所有LUN的数据。由北亚企安数据恢复工程师编写相对应程序来实现这个方案,根据编写好的程序去实现不同的功能:

a、编写程序扫描全部LUN_MAP,结合人工分析获取到LUN_MAP。

b、编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。

c、编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。

恢复出所有LUN的数据后由人工核对每个LUN,验证是否和用户方工程师描述的一致。

3、根据用户方工程师描述,所有LUN的数据可以分成两部份:1、Vmware的虚拟机;2、HP-UX上的裸设备,裸设备存放Oracle的dbf数据库。由于通过恢复出来的LUN无法看到里面的文件,因此需要人工核对哪些LUN是存放Vmware的数据,哪些LUN是HP-UX上的裸设备。核对完成后将不同的LUN挂载到不同的验证环境中进行验证。

4、将所有存放vmware虚拟机数据的LUN里面的虚拟机文件都生成出来,通过NFS共享的方式挂载到虚拟主机上,然后将虚拟机一个一个添加到清单。所有虚拟机加电开机后都能启动系统。用户方工程师亲自对虚拟机里面的数据进行验证没有发现问题。本次数据恢复工作完成。

服务器数据安全Tips:

1、定期巡查服务器&存储设备,发现报警及时处理。

2、操作要谨慎,避免误操作导致设备数据丢失。

3、如果发现EVA控制器模块不稳定,应当及时更换。

4、本案例中的EVA存储故障是由磁盘读写不稳定导致的,如果EVA存储中所有磁盘(掉线和没有掉线的)是同一批次,这些没有掉线的磁盘也应该快到极限,如果有条件建议更换掉这批磁盘。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4308

    浏览量

    85818
  • 服务器
    +关注

    关注

    12

    文章

    9138

    浏览量

    85373
  • 数据恢复
    +关注

    关注

    10

    文章

    569

    浏览量

    17442
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复—多块硬盘离线导致EVA存储崩溃的数据恢复案例

    一台HP EVA存储中有23块硬盘,挂接到一台windows server操作系统的服务器。 EVA
    的头像 发表于 12-03 13:32 114次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—多块<b class='flag-5'>硬盘</b><b class='flag-5'>离线</b>导致<b class='flag-5'>EVA</b><b class='flag-5'>存储</b>崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复EVA存储磁盘组磁盘掉线的数据恢复案例

    服务器存储数据恢复环境: 一台EVA某型号控制器+EVA扩展柜+FC磁盘。 服务器存储
    的头像 发表于 11-06 13:46 147次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存储</b>磁盘组磁盘掉线的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复EVA存储误删除VDISK的数据恢复案例

    服务器存储数据恢复环境: 某单位有一台EVA某型号存储主机+2个扩展柜,共12个FATA磁盘+10个FC磁盘,LUN数量不确定,操作系统为
    的头像 发表于 11-05 14:39 183次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存储</b>误删除VDISK的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    功率贴片电感的电感值不稳定的解决方法

    电子发烧友网站提供《功率贴片电感的电感值不稳定的解决方法.docx》资料免费下载
    发表于 09-19 17:40 0次下载

    LDO输出不稳定的原因

    LDO(Low Dropout Regulator,低压差线性稳压器)输出不稳定可能由多种因素导致。这些因素涉及电路设计、元件选择、工作环境以及外部干扰等多个方面。以下是对LDO输出不稳定原因的详细分析:
    的头像 发表于 09-11 10:28 1430次阅读

    服务器数据恢复—raid5阵列热备盘未全部成功启用的数据恢复案例

    检查策略十分严格,经常将硬盘的性能不稳定判定为硬件故障并将该硬盘踢出raid。很多情况下EMC存储中raid崩溃的原因就是磁盘读写
    的头像 发表于 08-14 11:27 388次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列热备盘未全部成功启用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    运放输出不稳定是什么原因

    的输出可能会出现不稳定的现象,这将严重影响电路的性能和可靠性。 电源问题 电源是运放正常工作的基础,如果电源不稳定或存在问题,将直接影响运放的输出稳定性。以下是一些常见的电源问题及其解决方案: 1.1 电源电压
    的头像 发表于 07-13 11:20 2065次阅读

    伺服电机转速不稳定的因素

    伺服电机转速不稳定的问题,通常涉及多个方面的因素。以下是针对这一问题的详细分析和解决方法: 一、原因分析 (1)电机本身问题: 转子失衡:电机转子不平衡可能导致转速不稳定。 热胀冷缩:电机在运
    的头像 发表于 06-19 11:18 1508次阅读

    电压不稳定对伺服电机有影响吗

    伺服电机是一种高精度、高响应速度的电机,广泛应用于工业自动化、机器人、航空航天等领域。然而,伺服电机在运行过程中,可能会受到电压不稳定的影响,从而影响其性能和寿命。本文将详细分析电压不稳定对伺服电机
    的头像 发表于 06-14 10:06 1630次阅读

    服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃的数据恢复案例

    服务器存储数据恢复环境: 某品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的raid5磁盘阵列,其中包含一块热备盘。分配了6个L
    的头像 发表于 06-12 11:30 305次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—磁盘<b class='flag-5'>不稳定</b>被踢导致raid5阵列崩溃的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    编码器供电电压不稳定怎么办

    编码器作为工业自动化系统中的重要组成部分,其稳定运行对于整个系统的性能至关重要。然而,在实际应用中,编码器供电电压不稳定的问题时有发生,这不仅会影响编码器的正常工作,还可能对系统造成严重的损害。因此
    的头像 发表于 05-29 16:02 950次阅读

    服务器数据恢复—raid5阵列中多块磁盘掉线导致EVA存储不可用的数据恢复案例

    服务器数据恢复环境: 1台某品牌EVA4400控制器+3台EVA4400扩展柜+28块FC硬盘。 服务器故障: 由于两块磁盘掉线导
    的头像 发表于 05-24 11:34 581次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—raid5阵列中多块磁盘掉线导致<b class='flag-5'>EVA</b><b class='flag-5'>存储</b>不可用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    EVA数据恢复EVA存储中磁盘掉线导致LUN丢失的数据恢复案例

    EVA存储数据恢复环境: EVA控制器+三个扩展柜+数十块FC硬盘
    的头像 发表于 04-19 13:28 371次阅读
    <b class='flag-5'>EVA</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存储</b>中磁盘掉线导致LUN丢失的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    【服务器数据恢复HP EVA虚拟化磁盘阵列数据恢复方案

    EVA是虚拟化存储,在工作过程中,EVA存储中的数据会不断地迁移,再加上运行在EVA上的应用都比
    的头像 发表于 02-18 11:23 654次阅读
    【服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>HP</b> <b class='flag-5'>EVA</b>虚拟化磁盘阵列<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>方案

    服务器数据恢复EVA存储数据恢复案例

    服务器数据恢复环境: 某品牌EVA某型号存储,底层是RAID5阵列,划分了若干lun。 服务器故障&分析: 该存储设备中raid5
    的头像 发表于 01-23 13:53 438次阅读