pysx0503
作者pysx05032020-04-17 16:54
系统工程师, 第十区。散人

RAID阵列恢复技术

字数 2074阅读 870评论 1赞 4

RAID恢复技术

课题产生背景**

随着RAID技术的普及,越来越多的设备应用到这项技术, 虽然RAID技术十分的成熟,效果也很理想,但这并不说明它是完美和足够安全的。由于RAID阵列依托与板载或者扩展的RAID阵列卡来实现对硬盘的RAID管理。而RAID阵列卡的技术水平。生产工艺以及这种特殊的结构给一些情况下的数据恢复造成了很多的困扰。

  1. 传统的存储模式是单硬盘的,无论是SAS接口还是SATA 或者SCSI接口,都是操作系统安在独立的一块硬盘至上,如果操作系统出现故障无法启动,我们可以通过其他机器挂载这块硬盘来恢复里面的数据。而RAID阵列是由多快硬盘按照一定的顺序和相同的信息来进行配置整合在一起的。如果操作系统无法启动,我们只能选择重装系统而无法进行传统的数据恢复,因为RAID阵列一旦脱离自己的RAID控制器,硬盘的RAID信息将会丢失,整个阵列也就散了。
  2. 由于RAID阵列的特殊结构,往往RAID阵列卡的逻辑故障或是设备老化就会轻易的造成整个RAID阵列崩溃。这种故障往往是没有预兆的,而RAID阵列卡一旦故障或者重新配置。RAID信息随之丢失。整个阵列中的数据也将被清除。
  3. 有时候由于管理员对RAID阵列卡的操作不熟悉,一个误操作就会导致整个RAID信息丢失,而建立在RAID阵列上的数据信息也会无法找回。

这些问题都会造成数据的丢失,而这种数据的丢失又无法像普通独立硬盘那样通过挂载到其他的计算机上读取数据。这就给系统管理者带来了不小的麻烦。

随着这些问题的产生,RAID恢复技术也逐渐的发展起来,成为数据恢复行业中的一个重要技术。

在这样的风险下,掌握RAID的恢复技术也就变的十分重要了。

:课题的实施

一般RAID故障主要包括以下情况

1、逻辑故障: a.突然断电造成RAID磁盘阵列信息的丢失。 b.重新配置RAID阵列信息,导致的数据丢失。 c.磁盘顺序混乱导致的系统不能识别数据。 d.误删除、误格式化、误分区、误克隆、文件解密、病毒破坏等。 2、硬件故障: a.RAID其中的某一块或某几块硬盘损坏导致RAID信息丢失,数据崩溃。 b.硬盘有坏道,导致数据读取出错。 c.RAID控制器故障导致数据丢失。

以上信息不难看出,RAID阵列的故障无论是硬件的还是软件的,最终的结果都是硬盘无法有效的形成阵列。那么只要通过软件对硬盘进行重组,就可以顺利的读取出原有的RAID阵列信息了。基于这样的理论,我们想要实现对RAID阵列信息的重建则需要了解以下的信息。

1、启始扇区;

2、条带块大小;

3、盘序;

4、校验方式;

5、数据结构 ;

6、磁盘坏损情况。

在我们通过工具对磁盘的这些信息进行分析之后就可以对Raid进行重组以达到数据恢复的目的。

:课题的实际测试效果。

(一)测试环境

实验环境:**

操作系统:WIN2003

硬件:曙光4380A服务器、HP Scsi接口磁盘阵列。

工具:磁盘检测工具,RAID分析工具,RAID重组工具

目标盘:2009年出现故障并拿到沈阳进行过数据恢复的数据中心硬盘4块,属于曙光4380A服务器,原操作系统WIN2003系统,上有BO文件,数据库等文件。硬盘在仓库已经闲置约5年。

(二)测试流程

  1. 连接服务器与磁盘阵列,把硬盘插入磁盘阵列,此处要求磁盘阵列和SCSI通道卡都不支持RAID功能。检查所有硬盘是否全部被识别,实际如图

其中一共插入了4块Maxtor 147G scsi硬盘,但从实际设备中只查询到了3块,在检重新检查连接后判断其中一块盘已经出现了物理损坏,由于RAID5是允许阵列中缺少一块磁盘,所以我还是继续进行测试。尝试对缺少一块硬盘的阵列进行数据分析。

  1. 分析磁盘坏道,分别扫描磁盘,

在打开磁盘分析工具之后如下

标识处也表明了在3插槽上的硬盘没有被识别。这进一步验证了前面的想法。3插槽上的磁盘已经损坏。接着对剩余的三块磁盘进行分析。

在对三块磁盘全部进行扫描之后发现只有1号插槽的磁盘有少量坏道。

3 .磁盘满足了基本的RAID运行条件,则开始对磁盘进行RAID信息分析,通过工具分析结果如下![]

得到的信息是阵列类型是RAID5 .一共由4快磁盘组成。条带块大小是256k,其实扇区是512 盘序为1,2,3,4,磁盘效验方式为左异步。 由于这一组磁盘是在沈阳数据恢复公司进行过恢复的,磁盘上标明了准确的磁盘顺序。这也印证了对阵列分析的结果是正确的,有了这些基本信息,我们就可以对RAID开始进行重建了

4 .我们选择了2款工具进行 阵列重建并对比了扫描出的数据结构。结果如下![]

通过对恢复出的主目录的对比发现两款工具所恢复出的数据结构基本一致,我选择了其中的部分数据库恢复后并附加到SQL 服务器上后测试正常。说明对RAID的重建和数据恢复成功。

由于测试条件有限,目前只能对Scsi类型的磁盘阵列进行恢复测试。不过对RAID恢复的基本原理和流程已经明确。

根据这套技术理论,在设备满足的条件下我们可以逐步实现数据自我恢复的程度,这在很大程度上也为企业提供了数据保障和扩展的业务空间。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论1 条评论

colerofyoucolerofyou系统架构师, SUN
2020-05-28 22:29
请问用到的工具方便说下吗?

pysx0503@colerofyou 因为时间有点久了。你可以加我微信pysx0503.我给你找找。当时手里的测试环境有限。只做了SCSI的测试。不过大体的原理是这样的。可以一起交流一下。

2020-06-04 10:02
Ctrl+Enter 发表

作者其他文章

X社区推广