博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据恢复过程之:服务器raid5两块硬盘离线数据恢复
阅读量:7107 次
发布时间:2019-06-28

本文共 1141 字,大约阅读时间需要 3 分钟。

服务器故障情况简介:

客户的一台ibm x3850服务器上组了一个raid5磁盘阵列,有两块硬盘离线,服务器崩溃。北亚数据恢复中心工程师对服务器进行初检,客户的磁盘阵列由5块硬盘组成,linux redhat 5.3操作系统,存储一个oracle数据库。阵列中有两块硬盘处于离线状态,热备盘未激活。硬盘无物理故障,无明显同步表现。
数据恢复方案:
1.关闭服务器同时确保在恢复过程中不再开启服务器,将故障盘进行标记后取出槽位挂载至数据恢复公司的备份服务器环境进行镜像备份。完成后恢复原故障服务器。
2.分析备份盘中的raid结构,得到原阵列中的raid界别、条带大小、校验方向、条带规则以及meta区域等信息。
根据分析出来的raid信息虚拟搭建一组raid5环境对磁盘文件系统进行解释,对虚拟结构的正确性检测,数据无误即可回迁数据。
服务器数据恢复及系统复原过程:

  1. 对原硬盘镜像后发现除了2号盘有10-20个坏扇区外其他硬盘均正常。
  2. 对raid结构进行分析,最佳盘序结构是0-1-2-3,缺失3号盘,结构如下图:
    数据恢复过程之:服务器raid5两块硬盘离线数据恢复
    3.组好后数据验证,200M以上的最新压缩包解压无报错,按照这一结构将虚拟raid生成到一块硬盘上,通过USB的方式把恢复后的单盘接入原服务器,通过linux SystemRescueCd启动故障服务器后使用dd命令进行全盘回写。
  3. 数据回写完成后无法进入操作系统,报错信息为:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。工程师使用SystemRescueCd重启后检查发现文件的权限、时间、大小都有明显错误,对根分区再次分析定位出错的/sbin/pidof/datahf.net,得出问题原因是2号盘坏道。
  4. 通过其他盘针对2号盘的损坏区域进行xor补齐并重新校验文件系统,依然有错误,工程师只好再次对inode表进行检查,发现2号盘损坏区域有部分节点表现为(图中的55 55 55部分):
    数据恢复过程之:服务器raid5两块硬盘离线数据恢复
    可以看出虽然节点中描述的uid还正常存在,但大小、属性、最初的分配块全部是错误的。通过日志确定原节点块的节点信息后进行修正,重新dd根分区,执行fsck -fn /dev/sda5/datahf.net检测,报错情况如下图:
    数据恢复过程之:服务器raid5两块硬盘离线数据恢复
    经过分析发现,原来3号盘最先离线,节点信息新旧交集导致有多个节点共用数据块,工程师按节点所属的文件进行区别,清除错误节点后,再次执行fsck -fn /dev/sda5,依然有部分位于doc目录下的节点报错,由于不影响启动所以强行修复后重启系统,系统正常,启动数据库正常。此次数据恢复工作成功。

转载于:https://blog.51cto.com/sun510/2094730

你可能感兴趣的文章
跟我学网站开发框架CodeIgniter之url篇
查看>>
表格响应式布局
查看>>
ssh connect no route
查看>>
iOS GCD队列dispatch简单的使用
查看>>
ARM11 paltform驱动代码完成,最简单的测试直接在装载设备中运行,实现秒读
查看>>
IDEA导入tomcat时无法导入javax.servlet.http包
查看>>
【工具使用系列】关于 MATLAB 图像处理工具箱,你需要知道的事
查看>>
对于一个程序员来说,什么最重要
查看>>
Chromium的智能指针/引用计数/Callback/Bind
查看>>
VIM自动补齐括号和引号
查看>>
MATLAB imresize 函数和 OpenCV resize 函数结果不同
查看>>
屏蔽Chrome(webkit)中的input、textarea的默认点击/聚焦高亮的样式
查看>>
tar安装包,linux 配置jdk1.7 按照步骤做就行
查看>>
初试刀 浅谈Java和C#在面向对象上语法的区别
查看>>
qmake中使用 pkgconfig
查看>>
mongo 数据备份与恢复
查看>>
表单验证(bootstrapValidator)
查看>>
关于反爬虫和恶意攻击的一些策略和思路
查看>>
常用u-boot命令详解(全) .
查看>>
算法导论——二叉查找树
查看>>