0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

EVA数据恢复—EVA存储中磁盘掉线导致LUN丢失的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-04-19 13:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

EVA存储数据恢复环境:
EVA控制器+三个扩展柜+数十块FC硬盘。

EVA存储故障&检测:
磁盘掉线导致存储中的部分LUN丢失,部分LUN损坏不可用。
由于是磁盘掉线导致存储中的LUN不可用。拿到所有磁盘后,先由硬件工程师对所有磁盘做物理故障检测,经过检测,没有发现有硬盘存在物理故障,都可以正常读取。使用坏道检测工具检测磁盘坏道,也没有发现有硬盘存在坏道。
磁盘坏道检测日志:

pYYBAGQ4z7yAKx95AAHQwWZpo1s129.png北亚企安数据恢复——EVA存储数据恢复


EVA存储数据恢复过程:
1、将所有磁盘以只读方式进行扇区级全盘镜像备份,镜像完成后将所有磁盘归还用户方,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

部分备份数据如下:

pYYBAGQ4z9eAcWTDAAEMV5itO04047.png北亚企安数据恢复——EVA存储数据恢复



2、由于所有磁盘都没有检测出物理故障或者坏道,因此可以初步判断磁盘掉线是某些磁盘读写不稳定造成的。EVA控制器的磁盘检查策略非常严格,会将性能不稳定的磁盘识别为坏盘并踢出磁盘组。一旦某个LUN的同一个条带中掉线的磁盘数量超过极限,这个LUN将不可用。如果EVA存储中所有的LUN都包含这些掉线的盘,所有LUN都会受影响。所以磁盘掉线导致整个EVA存储的LUN不可用的情况也可能出现。本案例中的情况是8个LUN正常,7个LUN损坏,6个LUN丢失。用户方要求恢复所有LUN的数据。
3、EVA存储的LUN是以RAID条目的形式存储数据的,EVA将每个磁盘的不同块组成一个RAID条目,RAID条目的类型有很多种。恢复数据之前需要分析出组成LUN的RAID条目类型以及RAID条目是由哪些盘的哪些块组成。这些信息都存放在LUN_MAP中,每个LUN都有一份LUN_MAP。EVA将LUN_MAP分别存放在不同的磁盘中并通过一个索引来指定其位置。因此在磁盘中找这个指向LUN_MAP的索引就可以找到现存LUN的信息。
4、虽然磁盘中记录了指向LUN_MAP的索引,但是它只记录现存的LUN,丢失的LUN是不会记录索引的。EVA中删除一个LUN只会清除这个LUN的索引,而不会清除这个LUN的LUN_MAP。所以只需要扫描所有磁盘找到所有符合LUN_MAP的数据块,然后排除掉现有的LUN_MAP,剩下的也不一定全是删除的LUN的LUN_MAP,也有一些是以前旧的LUN的LUN_MAP。使用北亚企安自主开发的程序将所有LUN_MAP的数据都恢复出来,然后通过人工去核对哪些是属于删除LUN的LUN_MAP。
5、虽然所有磁盘经过检测没有发现明显物理故障和坏道,但是可能会因为性能不稳定而被踢出磁盘组。这些被踢出的磁盘中存放了旧的数据,在生成数据的时候需要将这些磁盘都排除掉。如何判断哪些磁盘是掉线的呢?由于本案例中LUN的RAID级别大多是RAID5,只需要将一个LUN的RAID条目通过RAID5的校验算法算出校验值,再和原有的校验值作比较就可以判断这个条目中是否有掉线盘。将一个LUN的所有LUN_MAP都校验一遍就可以知道这个LUN中哪些RAID条目中有掉线盘,而这些RAID条目中都存在的那个盘就一定是掉线盘。排除掉线盘,然后根据LUN_MAP恢复所有LUN的数据即可。
6、北亚企安数据恢复工程师编写程序扫描全部LUN_MAP,结合人工分析获取到准确的LUN_MAP。北亚企安数据恢复工程师编写检测RAID条目的程序检测所有LUN中掉线的磁盘,结合人工分析排除掉线的磁盘。北亚企安数据恢复工程师编写LUN数据恢复程序,结合LUN_MAP恢复所有LUN数据。
7、人工核对每个LUN,确认是否和用户方工程师描述的一致。
部分LUN的数据:

pYYBAGQ4z96AaouiAAEI0gfaVlo547.png北亚企安数据恢复——EVA存储数据恢复



8、用户方对恢复出来的所有数据进行仔细检验后确认数据完整有效,认可本次数据恢复结果。本次服务器数据恢复工作完成。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    14

    文章

    10366

    浏览量

    91763
  • 数据恢复
    +关注

    关注

    10

    文章

    727

    浏览量

    19044
  • 磁盘
    +关注

    关注

    1

    文章

    401

    浏览量

    26592
  • LUN
    LUN
    +关注

    关注

    0

    文章

    4

    浏览量

    5663
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    服务器数据恢复—RAID5阵列同步中断双盘离线 存储崩溃数据恢复案例

    过程其中一块硬盘率先掉线,热备盘启动,数据同步重建。但在同步过程,阵列内又一块硬盘出现离线,导致数据
    的头像 发表于 04-23 12:49 24次阅读

    NetApp数据恢复—NetApp FAS-8200存储丢失故障数据恢复实战

    核心业务数据。运维过程因未知异常导致存储丢失,对应虚拟机全部无法访问。服务器管理员初步排查并尝试自行
    的头像 发表于 04-02 10:43 117次阅读
    NetApp<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—NetApp FAS-8200<b class='flag-5'>存储</b>卷<b class='flag-5'>丢失</b>故障<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>实战

    服务器数据恢复—多磁盘柜架构RAID5双盘离线数据恢复实战案例

    ; 2、 数据存储柜:每6块硬盘组建1组RAID5阵列,共36组RAID,划分为2个独立存储系统,承载核心用户数据(Data_LUN)。
    的头像 发表于 03-24 13:55 141次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—多<b class='flag-5'>磁盘</b>柜架构RAID5双盘离线<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>实战案例

    【服务器数据恢复】多盘掉线RAID6数据恢复:基于Reed-Solomon算法的修复

    ,当第三块硬盘离线后,RAID崩溃,服务器瘫痪,业务被迫停滞。 此时,如果直接更换硬盘重新组建阵列,阵列的所有数据将全部丢失。服务器管理员尝试分析和恢复数据,虽然找回了一部分
    的头像 发表于 03-05 16:37 468次阅读

    【服务器数据恢复EVA4400/6400/8400存储底层原理及数据恢复全流程

    难度极高。 EVA存储所用FC磁盘本质为SAS盘转接实现,加之虚拟化存储持续数据迁移、业务负载高,磁盘
    的头像 发表于 02-24 15:55 195次阅读
    【服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>EVA</b>4400/6400/8400<b class='flag-5'>存储</b>底层原理及<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>全流程

    【服务器数据恢复EVA存储硬盘离线,LUN丢后数据如何“重生”?

    将故障EVA存储设备上的所有硬盘编号后取出。硬件工程师对所有硬盘进行硬件故障检测。检测后发现掉线硬盘不存在物理故障和坏道。将所有硬盘以只读方式做全盘镜像备份,镜像完成后将所有磁盘按照编
    的头像 发表于 01-22 17:39 1257次阅读

    zfs数据恢复—ZFS存储迁移数据读不出数据怎么恢复数据

    管理员对一台存储设备内的文件进行迁移操作时,数据突然无法读取,管理界面出现报错。管理员查看数据时发现其中一个lun数据
    的头像 发表于 12-09 14:10 349次阅读
    zfs<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—ZFS<b class='flag-5'>存储</b>迁移<b class='flag-5'>数据</b>读不出<b class='flag-5'>数据</b>怎么<b class='flag-5'>恢复数据</b>?

    vsan数据恢复—Vsan故障与SQLserver数据数据恢复案例

    作缓存盘、2块机械硬盘作容量盘,共6个磁盘组构成VSAN存储空间存储虚拟机文件。 非正常关机导致VSAN逻辑架构出现故障,部分虚拟机
    的头像 发表于 12-02 11:58 453次阅读
    vsan<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—Vsan故障与SQLserver<b class='flag-5'>数据</b>库<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    Netapp数据恢复—Netapp存储数据恢复揭秘

    某公司一台服务器中一共有72块SAS硬盘。 工作人员误操作删除了十几个lun。需要恢复服务器数据
    的头像 发表于 10-28 15:26 512次阅读
    Netapp<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—Netapp<b class='flag-5'>存储</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>揭秘

    服务器数据恢复—EqualLogic存储上raid5磁盘阵列数据恢复案例

    服务器存储数据恢复环境&故障: 某品牌EqualLogic PS6100存储阵列上有一组由16块硬盘组建的raid5磁盘阵列。
    的头像 发表于 10-21 15:04 450次阅读

    服务器数据恢复—重装系统后OceanStor存储上的分区数据丢失这样恢复

    服务器存储数据恢复环境: 华为OceanStor某型号存储+扩展盘柜,存储的硬盘组建了rai
    的头像 发表于 09-02 15:32 778次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—重装系统后OceanStor<b class='flag-5'>存储</b>上的分区<b class='flag-5'>数据</b><b class='flag-5'>丢失</b>这样<b class='flag-5'>恢复</b>

    服务器数据恢复—热备盘上线过程硬盘掉线导致数据丢失数据恢复揭秘

    一台某品牌存储设备中有一组由8块硬盘(包括热备盘)组建的raid5磁盘阵列。上层安装的Linux操作系统。 raid5磁盘阵列有一块硬盘掉线,热备盘自动上线并开始同步
    的头像 发表于 08-26 13:24 415次阅读

    服务器数据恢复—StorNext文件系统数据丢失数据恢复案例

    服务器存储数据恢复环境&故障: 一台昆腾存储设备中有一组raid5磁盘阵列。阵列上有两块硬盘先后离线,raid5
    的头像 发表于 08-19 11:43 724次阅读

    Oracle数据恢复—格式化分区导致Oracle数据库报错的数据恢复案例

    完成后将所有硬盘按照原样还原到原服务器,后续的数据分析和数据恢复操作基于镜像文件进行,避免对原始磁盘
    的头像 发表于 07-22 14:06 527次阅读
    Oracle<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—格式化分区<b class='flag-5'>导致</b>Oracle<b class='flag-5'>数据</b>库报错的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—重装系统导致XFS文件系统分区丢失数据恢复案例

    服务器数据恢复环境&故障: 一台服务器上通过磁盘柜+RAID卡组建的riad5磁盘阵列,服务器上层安装Linux操作系统,搭建XFS文件系统。服务器上层分配一个
    的头像 发表于 06-12 11:20 918次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—重装系统<b class='flag-5'>导致</b>XFS文件系统分区<b class='flag-5'>丢失</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例