案例分享:在STK L180磁带库上爬过的坑

故事发生在3年前,在更换机房的一组光纤交换机的实施过程中,原光纤交换机因使用超限,决定将其更换为博科DS5100。交换机下联设备有存储、小型机、磁带库。光纤交换机使用端口zone,并反复确认了zone配置信息。切换当天,按照计划顺利实施。验证小型机和存储链路均正常。但业务验...显示全部

故事发生在3年前,在更换机房的一组光纤交换机的实施过程中,原光纤交换机因使用超限,决定将其更换为博科DS5100。交换机下联设备有存储、小型机、磁带库。光纤交换机使用端口zone,并反复确认了zone配置信息。切换当天,按照计划顺利实施。验证小型机和存储链路均正常。但业务验证时发现,NBU备份软件中,手动执行备份任务,有部分失败。

故障现象:查看NBU备份软件中日志,关于执行备份任务的报错,发现在STK L180磁带库上执行的备份任务均失败。

检查过程:首先,查看光纤链路标签,确认实施前后一致。接着,确认DS5100光纤交换机与L180磁带库的端口和ZONE划分也配置正确。然后,详细分析了交换机log信息,发现连接磁带机光纤卡的两个端口,只有FX流,没有RX数据流。

根据,以上故障现象及检查方式,基本上先排除光纤交换机和光纤链路的问题。问题聚焦在STK L180磁带库上。因平时很少出现问题,面对这台老古董,确实无从下手。

L180磁带库有3块光纤卡,其中一块为机械臂的光纤卡,另两块为磁带机的光纤卡。重新手动发起备份任务,观察老古董的工作,发现其机械臂可将磁带抓入磁带机,但两个磁带机均无法进行正常读写。备份任务无法正常执行。初步怀疑是两台磁带机的光纤卡有问题,可是磁带机上的光纤卡上连指示灯都没有,继续崩溃中。。。

硬着头皮在L180磁带机的面板中翻看信息,状态显示都正常无报错信息。继续仔细检查,发现两个磁带机的光纤卡速率speed仅为1 GBIT。 显示信息:speed : 1GBIT

1GBIT?会不会是跟新更换光纤交换机的端口速率不匹配呢?可是怎么修改磁带库的光纤卡速率呢?在面板上把所有选项翻个遍,根本没有更改端口速率的选项。心想,先不在这台老古董上浪费时间吧,去光纤交换机上改下吧。

紧接着登录到DS5100光纤交换机上,查看磁带机连接的端口模式为自适应,会不会是无法自适应1GBIT呢?决定将光纤交换机的该端口速率强制为1GBIT,修改后,重新执行备份任务,老古董的机械臂将磁带抓入磁带机中,然后就没有声音了。。。还是之前的故障现象。。。

马上跟光纤交换机厂商工程师确认,该型号交换机端口虽然可以强制1 GBIT,但硬件只能支持2 GBIT和4 GBIT以上。

看来,只能寄希望于修改这台老古董身上了,翻出已经落了灰的产品手册,看了2个多小时,终于发现了线索,L180磁带库在前面板上没有配置选项可以直接更改磁带机的光纤卡速率,只能通过修改LOOP ID值。LOOP ID 值为80,磁带机光纤卡速率为1 GBIT。Loop ID值 为126,磁带机光纤卡变为自适应。放下产品手册,赶紧跑到面板前,找到Loop ID的修改位置,将ID值改为126,磁带机的光纤卡速率变为自适应,  显示信息:speed : auto。

重新再NBU中发起备份任务,磁带机终于转动了。

收起
参与20

查看其它 4 个回答Jerry Miku的回答

Jerry MikuJerry Miku其它The Global 500

以前在L180上也摔过一回,情形是这样,磁带库搬迁,换了华为的交换机,重新配置后,ZONE设置,备份软件配置一样,磁带机微码更新到最新,但一些aix主机就是无法识别L180的磁带机。从网络查到操作系统,再到磁带库交换机,都检查过,多方调测问题依旧。最后关注微码的问题,查询多遍之后,终于原厂工程师发现了BUG,L180的HP磁带机在微码从某一特定版本升级时若是跳过该某一个版本到最新版本时,就会出现BUG。


案例时间比较久,微码版本已经讲不清了,提醒同行注意下磁带机微码的问题,最新微码往往也多坑,微码升级要谨慎。

IT其它 · 2016-12-23
浏览2758

回答者

Jerry Miku
其它The Global 500
擅长领域: 存储备份灾备

Jerry Miku 最近回答过的问题

回答状态

  • 发布时间:2016-12-23
  • 关注会员:9 人
  • 回答浏览:2758
  • X社区推广