互联网服务tsm备份故障案例

分享--一次TSM SERVER服务器物理位置迁移引发的备份失败

  起因:  

机房设备的搬迁,期间由于某个刀箱出现故障,其上的刀片迁移至其它刀箱,物理位置发生了变化,包括了一台运行TSM SERVER的刀片,但是日后发现所有备份任务都失败。

        经过检查发现,发生这些的原因在于没有考虑到刀片发生物理位置变化后,系统识别到的drive、library的物理地址也可能发生变化,没有进行详细的检查。

        下面把发生的过程记录下来,避免此类问题重现。

        环境:

               物理服务器:HS22

               OS:windows 2008 r2

               TAPE:TS3200

               TSM:V6

搬迁后例行检查过程:

       1、 TSM SERVER刀片物理位置变化后,开机,并启动TSM Server服务,进行例行的检查:

tsm: CICDEVTSM>q path

源名称          源类型          目的地名称      目的地类型     联机

-----------     -----------     -----------     ----------     ------

CICDEVTSM       SERVER          TS3200          LIBRARY        是

CICDEVTSM       SERVER          TS3200DRV1      DRIVE          是

CICDEVTSM       SERVER          TS3200DRV2      DRIVE          是

VMAGENTSTA      SERVER          TS3200DRV1      DRIVE          是

VMAGENTSTA      SERVER          TS3200DRV2      DRIVE          是


tsm: CICDEVTSM>q libr

库名           库类型       ACS    专用类别   临时类别   WORM       外部管理器       RSM 介质-    共享     不依赖    服从安装保留

                            标识                         临时类别                    类型                  LAN

------------   ----------   ----   --------   --------   --------   --------------   ----------   ------   -------   -----------------

TS3200         SCSI                                                                               是


tsm: CICDEVTSM>q dri

库名             驱动器名称       设备类型        联机

------------     ------------     -----------     -------------------

TS3200           TS3200DRV1       LTO             是

TS3200           TS3200DRV2       LTO             是


上述结果显示正常,并且所有调度任务的状态都是“未来”。

tsm: CICDEVTSM>q event * *

预定开始时间             实际开始时间             调度名称          节点名            状态

--------------------     --------------------     -------------     -------------     ---------

12/17/2014 20:00:00                               WINFS_CTXDEV-     WINFS_CTXDEV-     未来

                                                   FS01_SCHED01      FS01

12/17/2014 20:00:00                               WINFS_CTXDEV-     WINFS_CTXDEV-     未来

                                                   PVS02_SCHED-      PVS02


        按上述结果,认为TSM正常了,然后处理完其它问题,大家就收工了。


故障出现,分析处理:

        2、工作日,检查备份时,发现全部的备份任务都失败,报错如下:

(1)client端报:ANS1312E Server media mount not possible

(2)server端报:ANR8840E 无法打开错误号为 2 且 PVRRC 为 2839 的设备 lb0.1.0.1。

               ANR8441E SCSI 库 TS3200 的初始化失败。

               ANR1401W 卷 J04579L4 的安装请求被拒绝 - 安装失败。

               ANR8840E 无法打开错误号为 2 且 PVRRC 为 2839 的设备 lb0.1.0.1。

               ANR8441E SCSI 库 TS3200 的初始化失败。

               ANR1401W 卷 J04579L4 的安装请求被拒绝 - 安装失败。

               ANR8840E 无法打开错误号为 2 且 PVRRC 为 2839 的设备 lb0.1.0.1。

               ANR8441E SCSI 库 TS3200 的初始化失败。

               ANR1401W 卷 J04579L4 的安装请求被拒绝 - 安装失败。


         经过检查,发现TSM现有path里定义的library、drive的设备名称都发生了变化,这应该是因为刀片迁移位置后发生的变化。通过TSMDLST命令查看到的新名称:

TSM Name     ID   LUN  Bus  Port SSN                     WWN               TSM Type     Driver   Device Identifier

-----------------------------------------------------------------------------------------------------------------------

-----

mt5.0.0.1    5    0    0    1    1315511650              2114000E12519D46  LTO          IBM      IBM     ULT3580-TD4

C7QH

lb5.1.0.1    5    1    0    1    00L5U78F6744_LL0        2114000E12519D46  LIBRARY      IBM      IBM     3573-TL

B.90

mt5.0.0.2    5    0    0    2    1315532859              2115000E15619D46  LTO          IBM      IBM     ULT3580-TD4

C7QH

lb5.1.0.2    5    1    0    2    00L4U55F6744_LL0        2115000E15619D46  LIBRARY      IBM      IBM     3573-TL

B.90

处理过程:

        接下来,就需要修改path信息了,操作如下:

        先删除:

delete path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200

delete path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200

delete path cicdevtsm ts3200 srctype=server desttype=library

        再重建:

define path cicdevtsm ts3200 srctype=server desttype=library device=lb5.1.0.1

define path cicdevtsm ts3200drv1 srctype=server desttype=drive library=ts3200 device=mt5.0.0.1 autodetect=yes

define path cicdevtsm ts3200drv2 srctype=server desttype=drive library=ts3200 device=mt5.0.0.2 autodetect=yes

       然后,进行手工备份,状态正常。

ANR0406I 节点 WINFS_CTXDEVFS01(WinNT)(Tcp/Ip CTXDEVFS01(56752))的会话 20 已启动。

ANR8439I SCSI 库 TS3200 准备就绪进行操作。

ANR2017I 管理员 TSMADMIN 发出命令:QUERY MOUNT

ANR8379I 设备类 TS3200DEV 中的安装点正在等待卷安装完成,状态:WAITING FOR VOLUME。

ANR8334I         已查找到 1 个匹配项。

ANR8337I LTO 卷 J04579L4 装入到驱动器 TS3200DRV1 (mt5.0.0.1)。

ANR0511I 会话20打开输出卷J04579L4。

参与5

2同行回答

y453056108ry453056108r系统运维工程师某IT公司
复制到文本里看的更舒服,哈哈显示全部

复制到文本里看的更舒服,哈哈

收起
系统集成 · 2017-01-05
浏览1744
wangqlwangql系统工程师NULL
很典型的案例,楼主辛苦了显示全部

很典型的案例,楼主辛苦了

收起
IT咨询服务 · 2017-01-05
浏览1771

提问者

Acdante
Acdante111745
技术总监SHFY
擅长领域: 存储服务器数据库

问题来自

问题状态

  • 发布时间:2017-01-05
  • 关注会员:3 人
  • 问题浏览:4813
  • 最近回答:2017-01-05
  • X社区推广