0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式数据恢复-hbase+hive分布式存储误删除文件的数据恢复方案

Frombyte 来源:Frombyte 作者:Frombyte 2023-11-24 15:55 次阅读

hbase+hive分布式存储数据恢复环境:
16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive数据仓库。

hbase+hive分布式存储故障&初检:
数据库文件被误删除,数据库无法使用。
通过现场对该分布式环境的初步检测,发现虚拟机还可以正常启动,虚拟机里面的数据库块文件丢失。好在块文件丢失之后没有对集群环境写入数据,底层数据损坏可能性比较小。

hbase+hive分布式存储数据恢复方案:
1、备份。
A、从物理服务器底层做备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。
C、北亚企安数据恢复中心准备一台服务器以只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份。
D、备份完成后提供详细报告,内容涉及所有磁盘的健康状态和存在的坏道列表。
E、将服务器硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构。
A、分析每个虚拟机磁盘的块文件。
B、分析文件底层的聚合方式。
C、分析磁盘中数据分布情况。

3、分析Block文件key。
A、定位数据库文件中的key信息
B、提取并解析数据库文件中key信息。
C、整合数据库文件key信息。

4、拼接Block文件。
A、根据Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校验拼接后的Block文件的正确性。

5、导入Block文件。
A、校验提取出来的Block文件完整性和正确性。
B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。
由用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据恢复
    +关注

    关注

    10

    文章

    547

    浏览量

    17370
  • 分布式
    +关注

    关注

    1

    文章

    878

    浏览量

    74459
收藏 人收藏

    评论

    相关推荐

    WDS分布式存储系统软件助力电信工程海量数据存储项目

    WDS分布式存储系统软件助力电信工程海量数据存储项目
    的头像 发表于 11-11 09:59 109次阅读
    WDS<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统软件助力电信工程海量<b class='flag-5'>数据</b><b class='flag-5'>存储</b>项目

    服务器数据恢复—EXT3文件系统下误删除数据恢复案例

    服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统+EXT3文件系统。 服务器故障: 由于误删除导致
    的头像 发表于 10-23 15:11 123次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—EXT3<b class='flag-5'>文件</b>系统下<b class='flag-5'>误删除数据</b>的<b class='flag-5'>恢复</b>案例

    基于分布式存储系统医疗影像数据存储解决方案

    基于分布式存储系统医疗影像数据存储解决方案
    的头像 发表于 09-14 09:53 257次阅读
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统医疗影像<b class='flag-5'>数据</b><b class='flag-5'>存储</b>解决<b class='flag-5'>方案</b>

    医疗PACS影像数据的极速分布式存储解决方案

    医疗PACS影像数据的极速分布式存储解决方案
    的头像 发表于 08-23 10:13 263次阅读
    医疗PACS影像<b class='flag-5'>数据</b>的极速<b class='flag-5'>分布式</b>块<b class='flag-5'>存储</b>解决<b class='flag-5'>方案</b>

    NetApp数据恢复—NetApp存储误删除数据恢复案例

    某公司一台NetApp存储,该存储中有24块磁盘。 工作人员误删除了NetApp存储中一个文件夹,文件
    的头像 发表于 08-12 13:35 221次阅读
    NetApp<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—NetApp<b class='flag-5'>存储</b><b class='flag-5'>误删除</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    Oracle数据恢复—Oracle删除数据不用怕!这些数据恢复方法了解一下

    相信有很多oracle数据库用户都遇到过在操作Oracle数据库时误删除某些重要数据的情况,这个时候如果数据库没有备份且
    的头像 发表于 07-19 16:40 461次阅读

    服务器数据恢复误删除KVM虚拟机的数据恢复案例

    1台服务器,Linux操作系统+EXT4文件系统,部署了数台KVM虚拟机,每台虚拟机包含一个qcow2格的磁盘文件,和一个raw格式的磁盘文件。 工作人员操作失
    的头像 发表于 06-17 15:10 320次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>误删除</b>KVM虚拟机的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    鸿蒙开发接口数据管理:【@ohos.data.distributedData (分布式数据管理)】

    分布式数据管理为应用程序提供不同设备间数据库的分布式协同能力。通过调用分布式数据各个接口,应用程
    的头像 发表于 06-07 09:30 891次阅读
    鸿蒙开发接口<b class='flag-5'>数据</b>管理:【@ohos.data.distributedData (<b class='flag-5'>分布式</b><b class='flag-5'>数据</b>管理)】

    分布式存储与计算:大数据时代的解决方案

    分布式存储和计算技术应运而生,并迅速成为处理大数据的首选方案。本文将深入探讨分布式存储和计算的概
    的头像 发表于 03-07 14:42 687次阅读

    分布式智慧终端:挑战与解决方案

    是一个重要的问题。解决方案包括采用分布式一致性协议,如Paxos、Raft等,以及通过数据备份和恢复机制来确保数据的安全性。 故障容忍性挑战
    的头像 发表于 01-24 14:50 402次阅读

    【Vsan数据恢复】Vsan分布式存储虚拟磁盘文件丢失的数据恢复案例

    一套vsan分布式存储架构有数台服务器节点,该vsan分布式存储架构配置了固态硬盘和机械硬盘,固态硬盘作为缓存盘使用,机械硬盘作为容量盘使用。 机房供电异常导致服务器异常关机,工作人
    的头像 发表于 01-03 16:39 588次阅读

    鸿蒙原生应用开发——分布式数据对象

    分布式数据对象退出 sessionId 后,该对象将检测不到其他对象的变更。 02、分布式数据对象能力 1、分布式
    发表于 12-08 10:01

    redis分布式锁可能出现的问题及解决方案

    误删锁 Redis分布式锁通常使用SETNX命令创建,并使用DEL命令删除。在高并发情况下,可能会发生误删锁的情况,即一个线程A获得锁后,另一个线程B也可以获得锁并
    的头像 发表于 12-04 11:29 913次阅读

    zookeeper分布式原理

    是提供一个高可用的、一致性的机制,用于解决分布式系统中常见的一致性问题,比如Leader选举、分布式锁等。在本文中,我们将详细介绍Zookeeper的原理和工作机制。 数据模型 Zookeeper的
    的头像 发表于 12-03 16:33 612次阅读