wangql
作者wangql2016-11-16 14:55
系统工程师, NULL

某移动DS4700恢复方案

字数 2469阅读 5526评论 0赞 7

一.情况描述

1.1 事件概述

XX移动IBM小机挂接DS4700存储,由于存储故障导致数据丢失。后申请备用存储将DS4700数据DD到备用存储后,由数据恢复公司完成了数据恢复。目前业务在备用存储运行。为了修复DS4700并将业务迁回,特编写此方案。
注:此方案仅涉及DS4700配置和将数据从备用存储迁回的部分

1.2用户环境汇总

此方案所涉及的配置信息涉及两个方面,一是DS4700存储部分;二是IBM小型机AIX系统部分:
DS4700部分

表1:DS4700配置信息

控制器微码07.10.23.00
NVSRAMN1814D47R1010V05
ESM版本9898
Array1个 名称:0
Array下的lun3个
Lun 16.716 TB
Lun21.465 TB
Lun3698.141 GB

IBM AIX部分

表二:存储lun和aix pv对应表

存储lun名称及大小Aix hdisk名称所属卷组
Lun1 6.716THdisk11sambavg
Lun2 1.465THdisk9oraclevg
Lun3 698.141GHdisk10oraclevg

表三:逻辑卷分布图

二、迁移恢复方案

整个方案包含两个部分工作,一是DS4700部分,另一个是主机AIX部分。方案如下:

DS4700部分

  1. 断开主机到DS4700的连接,使用SM管理软件连接存储的两个控制器,用reset configuration选项清除存储的所有配置
  2. 下载DS4700最新的微码
    控制器微码:07.60.63.00
    ESM微码:esmhdd_v1.86
  3. 升级DS4700微码到最新
  4. 重新按照以前的配置划分array和lun,并映射给主机,等待磁盘初始化完毕

IBM AIX部分

5.两台aix主机识别DS4700映射的lun
以下操作仅在hacmp双机的主节点操作

6.使用bootinfo –s hdiskx命令得到新识别硬盘的容量,然后根据表2的对应关系,将相应容量的磁盘加入对应的卷组,这里假设新识别的盘和老盘的对应如下

原有盘新ds4700识别盘
Hdisk9Hdisk19
Hdisk10Hdisk20
Hdisk11Hdisk21

参考命令如下:

Extendvg –f oraclevg hdisk19 hdisk20
Extendvg –f sambavg hdisk21

7.参考表3,使用mklvcopy命令创建逻辑卷的副本,且不同步,参考命令如下:

Mklvcopy –s y loglv00 2 hdisk19
Mklvcopy –s y fslv00 2 hdisk19
Mklvcopy –s y fslv01 2 hdisk19
Mklvcopy –s y fslv02 2 hdisk19
Mklvcopy –s y fslv03 2 hdisk19

Mklvcopy –s y loglv01 2 hdisk21
Mklvcopy –s y fslv04 2 hdisk21
Mklvcopy –s y fslv05 2 hdisk21

注:以上命令会为指定的lv在指定的pv上创建一个副本,并且不会同步,所以编辑好批量执行。需要注意的是,批量操作直接需要估算要迁移到的pv的容量是否够用。

8.根据步骤7的执行,使用syncvg命令分批同步这些镜像的逻辑卷,参考命令如下:

Syncvg –l –P 4 –f loglv00
Syncvg –l –P 4 –f fslv00
Syncvg –l –P 4 –f fslv01
Syncvg –l –P 4 –f fslv02
Syncvg –l –P 4 –f fslv03

Syncvg –l –P 4 –f loglv01
Syncvg –l –P 4 –f fslv04
Syncvg –l –P 4 –f fslv05

注:以上的命令是按lv的方式来同步的,也可以以pv或vg来同步。这里的-P 4指的是并行同步pp的数量,这里指定了4个,开始可以选几个小的lv来测试,找一个合适的值。可以一个个的lv来进行,也可以多个进行,并行多了会影响IO,注意测试权衡即可。

9.使用lsvg vgname命令可以检查同步的进度,当下图中stale pps的值为0时,同步完成

10.使用rmlvcopy命令解除lv镜像关系,参考命令如下

Rmlvcopy loglv00 1 hdisk9
Rmlvcopy fslv00 1 hdisk9
Rmlvcopy fslv01 1 hdisk9
Rmlvcopy fslv02 1 hdisk9
Rmlvcopy fslv03 1 hdisk9

Rmlvcopy loglv01 1 hdisk11
Rmlvcopy fslv04 1 hdisk11
Rmlvcopy fslv05 1 hdisk11

11.使用lspv –l hdiskx命令确保老盘上已经没有lv
Lspv –l hdisk9
Lspv –l hdisk11

12.使用reducevg命令删除老盘
Reducevg oraclevg hdisk9 hdisk10
Reducevg sambavg hdisk11

13.使用rmdev –Rdl hdiskx命令删除老盘
Rmdev –Rdl hdisk9
Rmdev –Rdl hdisk10
Rmdev –Rdl hdisk11

14.移除光纤线,将替换存储下架即可。

HACMP部分

之前的操作是在hacmp的主节点进行的,卷组信息发生了改变,备节点需要重新识别

  1. 两个节点使用smit clstop关闭hacmp集群,这时共享卷组会自动varyoff
  2. 到备节点,执行exportvg命令将两个卷组导出
    Exportvg oraclevg
    Exportvg sambavg
  3. 备节点重新导入vg
    Importvg –y oraclevg hdisk19
    Importvg –y sambavg hdisk21
  4. 被节点将卷组varyoff
    Varyoffvg oraclevg
    Varyoffvg sambavg
  5. 两个节点使用smit clstart命令启动集群

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

7

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

AIX运维专栏
专注于AIX系统运维,系统管理。

作者其他文章

相关文章

相关问题

相关资料

X社区推广