首页
学习
活动
专区
工具
TVP
发布

分布式存储恢复hbase和hive数据库报告

分布式存储数据恢复设备清单及基本描述

初检方案及过程

存储数据恢复初检方式:根据与客户电话沟通及现场检测,按故障表现,作如下判断:

故障表现:客户共配置16台服务器节点,在每台物理服务器存储上,有大约3台左右的虚拟机,在虚拟机上配置的分布式,上层部署的hbase数据库和hive数据库,数据库底层文件删除,导致数据库不能使用。

数据恢复概率预判:

经过现场对客户环境的简单检测,虚拟机还可以正常启动,虚拟机里面的数据库块文件有丢失,块文件丢失之后,没有对整个集群环境在进行数据的写入,底层的数据损坏可能性会比较小。

综上所述,由于在删除之后,没有在继续写入数据,具有较大的可恢复性,但是由于现阶段还没有对底层结构进行分析,再加上hbase和hive的算法和底层结构十分复杂,具体的恢复概率无法判断,还需在之后具体的数据恢复过程中才可以知晓。

分布式存储数据恢复服务流程

1、前期备份流程

A、从物理服务器存储底层做备份,将原存储设备断电、关机。

B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。

C、准备一台恢复操作服务器(北亚提供),在数据恢复平台上以只读方式挂载服务器硬盘,使用北亚磁盘备份工具(或 dd等工具)进行完整的扇区对扇区的备份。

D、备份完成后,提供详细报告,涉及威信的健康状态及可能存在的坏道列表。

E、将服务器硬盘交回给用户(建议原样恢复),之后不再直接操作原介质。

2、服务器存储块文件结构分析

A、对每个虚拟机磁盘的块文件进行分析;

B、分析文件底层的聚合方式;

C、分析每个磁盘中数据的分布情况;

3、Block文件key分析

A、定位数据库文件中的key信息;

B、提取并解析数据库文件中key信息;

C、整合数据库文件key信息。

4、Block文件拼接

A、根据Block文件的key信息提取文件片段;

B、对Block文件的片段进行拼接;

C、校验拼接后的Block文件的正确性。

5、Block文件导入

A、校验提取出的Block文件完整性及正确性;

B、把提取出来的Block文件导入到hbase和hive数据库中;

6、服务器存储数据恢复结果验证

A、由用户主导对数据本身进行详细验证。

B、如发现新问题,重新检验上述所有数据恢复过程。

数据恢复服务承诺 

1、整个过程不会对客户的原盘有任何的写操作,以确保原盘的数据安全

2、尽最大可能保证服务的操作可逆,确保人力可控范围内操作可回溯。

3、提供后期数据保管和服务跟踪。

4、以上所有操作在有备份的情况下进行,若不成功不影响其他方案继续。

数据恢复周期预估

说明:总时间控制在20个工作日,上表中的时间只是预估,以实际情况为准。

分布式存储数据恢复成功率预估

数据安全救援的可靠度应超过 80%。参考:2020年全年企业级数据安全救援的最终成功率为 84.3%。因不存在同步及基本可排除的硬件故障。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210119A099Y100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券