互联网服务

AIX5.3TL11无法正常访问外部存储的解决方案

AIX5.3TL11及AIX6.1TL04无法正常访问外部存储的解决方案

今天碰到一个客户打电话来说,他们去年买的P550因为要升级SYBASE,听取了SYBASE供货商的建议,把08升级到11了。
结果重启主机的时候发现几乎挂起,等待将近半小时才把系统起来;运行cfgmgr和powerpath config(配置emc设备的命令)时需要将近20分钟才能完成。

他们怀疑是EMC POWERPATH不兼容导致,需要我的支持。
因为阵列是由我们提供,因此我负责寻找阵列和POWERPATH方面的原因。

从电话中得知,AIX没升级之前阵列及POWERPATH都无异常(POWERPATH为5.3版本),难道AIX53TL11真的不兼容5.3版本的POWERPATH?可是不会啊,5.3是最新的了;忽然想起该版本还有个补丁,不知道是否已经打上?

马上回电话过去---powerpath version输出,果然没有打补丁。
马上登陆POWERLINK,下载POWERPATH5.3的SP1补丁传过去。
补丁打完,尝试重启和cfgmgr,问题依然没有解决。

于是又想,目前TL11是AIX5.3的最新版本,之前没有碰到该版本的主机,难道是AIX本身的BUG?

上EMC支持库,果然给我发现:原来AIX5.3TL11及AIX6.1TL04版本下要安装几个补丁才能正常访问非MPIO存储设备。也即是说,以上故障根本就是AIX的BUG,不管连接什么存储,只要没有使用MPIO,那么AIX5.3TL11及AIX6.1TL04都无法正常使用这些存储设备。
======================================
Environment:  
OS: IBM AIX 6.1 TL4 SP1
OS: IBM AIX 6.1 TL2
OS: IBM AIX 5.3 TL11
OS: VIOS 2.1.10.22 (FP22)
EMC SW: PowerPath 5.1
EMC SW: PowerPath 5.3.1
Product: Symmetrix
Product: CLARiiON

Problem:  
System hangs on cfgmgr when attempting to configure SAN devices.
Reserve Lock, which is needed in VIO, Oracle and PowerPath environments, changes back to yes when it should be no.

cause:
The cause is non-MPIO (hdiskpower) devices.  FC DISKS will define a new Hdisk instance upon each reboot if a PVID stamp exists on the disk, but no PVID attributes exists in ODM.  Reserve Lock is then changed back to yes, and a reserve is placed on all the new Hdisk instances.  The fix was created to match non-MPIO FC Disks that have a PVID stamp against the connection information of the device.

For AIX v6.1
Apply APARs IZ63813, IZ64056, IZ64133
IZ63818, IZ64056, IZ64133 – Are planned to be part of AIX 6.1 TL4 SP2, which is targeted to be available Feb 2010
All three APARs/IFIXes are currently available for this problem, and must be loaded as a group for AIX 6.1 T.L.4.
Obtain IZ64056 through normal download channels of IBM.
For IZ63813 & IZ64133, please obtain them from the public IBM FTP site as described:

ftp public.dhe.ibm.com
login = anonymous
password = email address
cd aix/efixes/iz63813
cd aix/efixes/iz64133

For AIX v5.3
Apply APARs IZ63977, IZ63808.
IZ63977 & IZ63808 - Scheduled to be part of AIX 5.3 base TL12, currently targeted to be available in April 2010.
These are two APARs are currently available for this problem, and must be loaded as a group for this level AIX 5.3 T.L.11.and are available
Obtain IZ63977 through normal download channels of IBM.
For IZ63808, please obtain it from the public IBM FTP site as described:

ftp public.dhe.ibm.com
login = anonymous
password = email address
cd aix/efixes/iz63808
NOTE: If running PowerPath 5.3, SP1 MUST be installed as part of the fix
==========================================
从以上内容得知:IZ63808这个补丁能在FTP站点下载,但是IZ63977需要到FIXCENTER上通过WEB来下载。
结果发现,IZ63808是可以下载,但是根本装不上,而IZ63977根本就找不到!
以下是IZ63808安装过程
# ls -l IZ*
-rw-r-----    1 root     system       615393 Jan 18 23:22 IZ63808.epkg.Z
# instfix -k IZ63808 -d .
instfix: There are no filesets on the media for IZ63808.
instfix: There are no filesets on the media for the requested Fix IDs.
# uncompress IZ63808.epkg.Z
# instfix -T -d .
没有任何输出,即表示根本没有这个补丁存在。
难道是上传时没用2进制模式?再试,自动模式2进制模式都尝试过了,都不行;又到IBM站点去找,原来IBM也有文档提到这个BUG
=====================
IZ63977: NON-MPIO DISK WITHOUT PVID ATTRIBUTE CAUSES NEW DISK DEFINES.
APAR statusClosed as program error.
Error descriptionnon-MPIO FC Disks will define a new hdisk instance on each
reboot, if a PVID stamp exists on the disk, but no PVID
attribute exists in ODM.
Local fix
Problem summarynon-MPIO FC Disks will define a new hdisk instance on each
reboot, if a PVID stamp exists on the disk, but no PVID
attribute exists in ODM.
Problem conclusionProperly match non-MPIO FC Disks which have a PVID stamp
against the connection information of the device.
====================
主机工程师致电IBM800,得到一个让人听了马上晕倒的答案:这些补丁目前还没正式对外发布!
既然没有发布,为什么其中一个补丁可以下载,而且IBM和EMC站点都提到这个BUG及其解决方案?

最后,只得回退到原来的版本(幸亏系统有备份),并升级到10后,以上问题再没出现过。
呵呵,现在知道备份有多重要了吧。
另外,除非必要,最好不要使用最新版本的软件,否则很可能当小白鼠。
参与72

65同行回答

qinwen20520qinwen20520专业技术支持人员无业
学习中 ~显示全部
学习中 ~收起
2010-06-11
浏览662
yghuiaixyghuiaix技术经理昕网格
积极支持,非常感谢显示全部
积极支持,非常感谢收起
IT分销/经销 · 2010-06-11
浏览688
GooogleuGooogleu学生y.co
处理问题很老练:handshake显示全部
处理问题很老练:handshake收起
互联网服务 · 2010-06-09
浏览725
土豆叶子土豆叶子工程师大众软件
收藏一下先,有时间慢慢学习。显示全部
收藏一下先,有时间慢慢学习。收起
IT分销/经销 · 2010-06-07
浏览683
myguangzhoumyguangzhou技术经理Uniwise
有补丁了 兄弟这只是连接EMC时候才会出现的问题dark0302 发表于 2010-5-22 10:13 这是去年发生的事情了兄弟,你把链接给我们一下?啥时候的补丁:lol显示全部
有补丁了 兄弟
这只是连接EMC时候才会出现的问题
dark0302 发表于 2010-5-22 10:13

这是去年发生的事情了
兄弟,你把链接给我们一下?啥时候的补丁:lol收起
互联网服务 · 2010-06-03
浏览687
roman1985roman1985软件开发工程师北明软件
刚看到这个,LZ不错嘛,学习了显示全部
刚看到这个,LZ不错嘛,学习了收起
互联网服务 · 2010-06-02
浏览702
zmjie1985zmjie1985系统工程师北科时代
是啊,太新的软件还不成熟,就有bug啊。显示全部
是啊,太新的软件还不成熟,就有bug啊。收起
互联网服务 · 2010-06-02
浏览719
zmjie1985zmjie1985系统工程师北科时代
呵呵。学习了显示全部
呵呵。学习了收起
互联网服务 · 2010-06-02
浏览745
黄涛黄涛系统工程师博雅软件股份有限公司
很好的案例, 一则说明备份的重要性,又能说明升级前了解兼容性的重要,还能分享解决问题的思路, 感谢楼主显示全部
很好的案例, 一则说明备份的重要性,又能说明升级前了解兼容性的重要,还能分享解决问题的思路, 感谢楼主收起
IT分销/经销 · 2010-05-24
浏览704
benaixbenaix信息技术经理ithink service
不错的经验 呀的确 备份真的很重要 學習了!显示全部
不错的经验 呀
的确 备份真的很重要 學習了!收起
IT咨询服务 · 2010-05-23
浏览717

提问者

myguangzhou
技术经理Uniwise
擅长领域: 服务器AIXUnix

问题状态

  • 发布时间:2010-01-18
  • 关注会员:0 人
  • 问题浏览:39486
  • 最近回答:2010-12-06
  • X社区推广