0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式数据恢复-hbase+hive分布式存储误删除文件的数据恢复方案

Frombyte 来源:Frombyte 作者:Frombyte 2023-11-24 15:55 次阅读

hbase+hive分布式存储数据恢复环境:
16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive数据仓库。

hbase+hive分布式存储故障&初检:
数据库文件被误删除,数据库无法使用。
通过现场对该分布式环境的初步检测,发现虚拟机还可以正常启动,虚拟机里面的数据库块文件丢失。好在块文件丢失之后没有对集群环境写入数据,底层数据损坏可能性比较小。

hbase+hive分布式存储数据恢复方案:
1、备份。
A、从物理服务器底层做备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。
C、北亚企安数据恢复中心准备一台服务器以只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份。
D、备份完成后提供详细报告,内容涉及所有磁盘的健康状态和存在的坏道列表。
E、将服务器硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构。
A、分析每个虚拟机磁盘的块文件。
B、分析文件底层的聚合方式。
C、分析磁盘中数据分布情况。

3、分析Block文件key。
A、定位数据库文件中的key信息
B、提取并解析数据库文件中key信息。
C、整合数据库文件key信息。

4、拼接Block文件。
A、根据Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校验拼接后的Block文件的正确性。

5、导入Block文件。
A、校验提取出来的Block文件完整性和正确性。
B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。
由用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据恢复
    +关注

    关注

    10

    文章

    568

    浏览量

    17432
  • 分布式
    +关注

    关注

    1

    文章

    895

    浏览量

    74498
收藏 人收藏

    评论

    相关推荐

    使用lsof实现对linux文件误删除恢复练习

    本文记录使用lsof实现对linux文件误删除恢复练习。题目如下: 1.确保当前nginx进程运行中 2.删除日志文件,rm -f /va
    的头像 发表于 11-24 11:14 173次阅读
    使用lsof实现对linux<b class='flag-5'>文件</b>的<b class='flag-5'>误删除</b><b class='flag-5'>恢复</b>练习

    WDS分布式存储系统软件助力电信工程海量数据存储项目

    WDS分布式存储系统软件助力电信工程海量数据存储项目
    的头像 发表于 11-11 09:59 179次阅读
    WDS<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统软件助力电信工程海量<b class='flag-5'>数据</b><b class='flag-5'>存储</b>项目

    服务器数据恢复—EXT3文件系统下误删除数据恢复案例

    服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统+EXT3文件系统。 服务器故障: 由于误删除导致
    的头像 发表于 10-23 15:11 158次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—EXT3<b class='flag-5'>文件</b>系统下<b class='flag-5'>误删除数据</b>的<b class='flag-5'>恢复</b>案例

    基于分布式存储系统医疗影像数据存储解决方案

    基于分布式存储系统医疗影像数据存储解决方案
    的头像 发表于 09-14 09:53 303次阅读
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统医疗影像<b class='flag-5'>数据</b><b class='flag-5'>存储</b>解决<b class='flag-5'>方案</b>

    医疗PACS影像数据的极速分布式存储解决方案

    医疗PACS影像数据的极速分布式存储解决方案
    的头像 发表于 08-23 10:13 317次阅读
    医疗PACS影像<b class='flag-5'>数据</b>的极速<b class='flag-5'>分布式</b>块<b class='flag-5'>存储</b>解决<b class='flag-5'>方案</b>

    NetApp数据恢复—NetApp存储误删除数据恢复案例

    某公司一台NetApp存储,该存储中有24块磁盘。 工作人员误删除了NetApp存储中一个文件夹,文件
    的头像 发表于 08-12 13:35 257次阅读
    NetApp<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—NetApp<b class='flag-5'>存储</b><b class='flag-5'>误删除</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    Oracle数据恢复—Oracle删除数据不用怕!这些数据恢复方法了解一下

    相信有很多oracle数据库用户都遇到过在操作Oracle数据库时误删除某些重要数据的情况,这个时候如果数据库没有备份且
    的头像 发表于 07-19 16:40 507次阅读

    服务器数据恢复误删除KVM虚拟机的数据恢复案例

    1台服务器,Linux操作系统+EXT4文件系统,部署了数台KVM虚拟机,每台虚拟机包含一个qcow2格的磁盘文件,和一个raw格式的磁盘文件。 工作人员操作失
    的头像 发表于 06-17 15:10 351次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>误删除</b>KVM虚拟机的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    鸿蒙开发接口数据管理:【@ohos.data.distributedData (分布式数据管理)】

    分布式数据管理为应用程序提供不同设备间数据库的分布式协同能力。通过调用分布式数据各个接口,应用程
    的头像 发表于 06-07 09:30 960次阅读
    鸿蒙开发接口<b class='flag-5'>数据</b>管理:【@ohos.data.distributedData (<b class='flag-5'>分布式</b><b class='flag-5'>数据</b>管理)】

    HarmonyOS开发实例:【分布式数据服务】

    分布式数据服务(Distributed Data Service,DDS)为应用程序提供不同设备间数据分布式的能力。
    的头像 发表于 04-18 10:18 705次阅读
    HarmonyOS开发实例:【<b class='flag-5'>分布式</b><b class='flag-5'>数据</b>服务】

    分布式存储与计算:大数据时代的解决方案

    分布式存储和计算技术应运而生,并迅速成为处理大数据的首选方案。本文将深入探讨分布式存储和计算的概
    的头像 发表于 03-07 14:42 752次阅读

    分布式智慧终端:挑战与解决方案

    是一个重要的问题。解决方案包括采用分布式一致性协议,如Paxos、Raft等,以及通过数据备份和恢复机制来确保数据的安全性。 故障容忍性挑战
    的头像 发表于 01-24 14:50 439次阅读

    【Vsan数据恢复】Vsan分布式存储虚拟磁盘文件丢失的数据恢复案例

    一套vsan分布式存储架构有数台服务器节点,该vsan分布式存储架构配置了固态硬盘和机械硬盘,固态硬盘作为缓存盘使用,机械硬盘作为容量盘使用。 机房供电异常导致服务器异常关机,工作人
    的头像 发表于 01-03 16:39 616次阅读

    分布式IO工业自动化数据采集与分析的核心

    工业自动化生产的效率。在传统的工业自动化生产中,设备的控制和监测通常采用集中式控制方式,这种方式存在着设备连接复杂、数据传输速度慢、故障率高和扩展性差等问题。而分布式IO采用分布式控制方式,将设备按照
    发表于 12-28 14:47