0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式数据恢复-hbase+hive分布式存储误删除文件的数据恢复方案

Frombyte 来源:Frombyte 作者:Frombyte 2023-11-24 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

hbase+hive分布式存储数据恢复环境:
16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive数据仓库。

hbase+hive分布式存储故障&初检:
数据库文件被误删除,数据库无法使用。
通过现场对该分布式环境的初步检测,发现虚拟机还可以正常启动,虚拟机里面的数据库块文件丢失。好在块文件丢失之后没有对集群环境写入数据,底层数据损坏可能性比较小。

hbase+hive分布式存储数据恢复方案:
1、备份。
A、从物理服务器底层做备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。
C、北亚企安数据恢复中心准备一台服务器以只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份。
D、备份完成后提供详细报告,内容涉及所有磁盘的健康状态和存在的坏道列表。
E、将服务器硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构。
A、分析每个虚拟机磁盘的块文件。
B、分析文件底层的聚合方式。
C、分析磁盘中数据分布情况。

3、分析Block文件key。
A、定位数据库文件中的key信息。
B、提取并解析数据库文件中key信息。
C、整合数据库文件key信息。

4、拼接Block文件。
A、根据Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校验拼接后的Block文件的正确性。

5、导入Block文件。
A、校验提取出来的Block文件完整性和正确性。
B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。
由用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据恢复
    +关注

    关注

    10

    文章

    733

    浏览量

    19072
  • 分布式
    +关注

    关注

    1

    文章

    1116

    浏览量

    76737
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的实战应用中,优化数据加载路径是提升训练效率的关键技术手段。科技视角下的解决方案,引入了多级缓存与智能预取机制。 针对训练数据集中频繁访问的热点数据,高性能的
    发表于 05-01 17:35

    2022全新版!Java分布式架构设计与开发实战(完结)

    2022全新版!Java分布式架构设计与开发实战(完结) 分库分表实战:Java海量数据存储架构设计 在现代互联网应用中,随着业务规模的指数级增长,数据库性能瓶颈已成为制约系统发展的
    发表于 03-30 15:20

    TiDB分布式数据库运维实践

    TiDB 是 PingCAP 开发的开源分布式关系型数据库,兼容 MySQL 5.7 协议,底层存储基于 TiKV(分布式 KV 存储)和
    的头像 发表于 03-04 15:44 382次阅读

    分布式数据恢复—Ceph+TiDB数据恢复报告

    无法正常访问。目标需要恢复的RBD卷中存储了一台虚拟机的完整磁盘镜像,该虚拟机内部运行TiDB分布式数据库系统,包含重要的业务数据
    的头像 发表于 02-03 17:22 306次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—Ceph+TiDB<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>报告

    分布式能源管理物联网解决方案

    ,构建全链路能源数据采集与管控体系,实现分布式能源的精细化管理与智能化运维。 方案架构 终端设备层:现场设备包括光伏逆变器、智能电表、电池管理系统(BMS)等各类能源设备,支持IEC61850、IEC101/103/104、DL
    的头像 发表于 01-21 11:39 546次阅读
    <b class='flag-5'>分布式</b>能源管理物联网解决<b class='flag-5'>方案</b>

    vsan数据恢复—VSAN超融合架构:供电异常的vsan数据恢复案例

    Vsan是一种可扩展的分布式存储架构,这种存储架构区别于其他存储架构的地方在于由vsan进行管理和控制的vsan存储层。另外vsan
    的头像 发表于 12-04 16:17 861次阅读

    Mysql数据恢复—Windows Server下MySQL(InnoDB)全表误删数据恢复案例

    本地服务器,操作系统为windows server。服务器上部署mysql单实例,innodb引擎,独立表空间。未进行数据库备份,未开启binlog。 人为误操作使用Delete命令删除数据时未添加where子句,导致全表数据
    的头像 发表于 09-23 15:56 909次阅读
    Mysql<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—Windows Server下MySQL(InnoDB)全表<b class='flag-5'>误删</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

    分布式光伏本地和远程通信方案,并研究分布式光伏采集模型的构建、多源数据融合估计、面向分布式光伏的有功、无功功率优化控制等关键技术,实现了对小
    的头像 发表于 08-23 08:04 3736次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统在奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的全方位、高精度、实时化管理。该系统能
    的头像 发表于 08-22 10:51 3579次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统技术<b class='flag-5'>方案</b>

    服务器数据恢复—服务器上的卷被误删数据如何恢复

    工作人员不慎将一台服务器上的卷误删除,服务器上有一组raid5阵列。需要恢复误删除数据
    的头像 发表于 08-14 11:33 1163次阅读
    服务器<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—服务器上的卷被<b class='flag-5'>误删</b><b class='flag-5'>数据</b>如何<b class='flag-5'>恢复</b>?

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、
    的头像 发表于 08-04 11:34 1906次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式
    的头像 发表于 07-14 11:15 1310次阅读

    分布式IO选型指南:2025年分布式无线远程IO品牌及采集控制方案详解

    。2025年,分布式IO市场呈现出技术革新与品牌竞争加剧的态势。本文基于权威数据平台(如Statista、MarketsandMarkets、Grand View Research)的市场分析,全面解读分布式无线远程IO的选型要
    的头像 发表于 06-23 09:48 1563次阅读

    双电机分布式驱动汽车高速稳定性机电耦合控制

    和控制器的工作强度。 纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:双电机分布式驱动汽车高速稳定性机电耦合控制.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-18 16:37

    vsan数据恢复—vsan分布式服务器节点上raid数据恢复案例

    4台服务器基于vsan分布式架构的组建一个集群。每台节点服务器上有2组由6块硬盘组建的raid磁盘阵列,上层存放虚拟机文件。 某一个服务器节点上有一块硬盘离线,vsan的数据安全机制启动,开始重构
    的头像 发表于 06-18 12:29 707次阅读