经典实施案例征集。。。。

如果在实施排错过程中有好的案例。。。可以贴上来与大家共享。按照案例的优质程度加分哦。
参与37

37同行回答

myciciymyciciy联盟成员IT顾问某金融科技公司
劣质材料害死人!显示全部
劣质材料害死人!收起
银行 · 2009-03-08
浏览1196
myciciymyciciy联盟成员IT顾问某金融科技公司
一台650能够看到pv (fast600),rmdev 然后cfgmgr 也能再找到,但是mkvg 不成功,现象就是显示running就不动了,看errpt也没错误,重新安装系统两便,从其他机器克隆一次,折腾两天并请教高手和ibm浪费电话费无数还是没有结果,后来偶然发现后面的光纤时断时通,更换后马上解决。 劣质材料害...显示全部
一台650能够看到pv (fast600),rmdev 然后cfgmgr 也能再找到,但是mkvg 不成功,现象就是显示running就不动了,看errpt也没错误,重新安装系统两便,从其他机器克隆一次,折腾两天并请教高手和ibm浪费电话费无数还是没有结果,后来偶然发现后面的光纤时断时通,更换后马上解决。 劣质材料害死人!收起
银行 · 2009-01-18
浏览1187
myciciymyciciy联盟成员IT顾问某金融科技公司
hacmp5.2 + orcal9i 创建控制文件 访问 lv 出错     环境:(产品hacmp ,平台pseries,机型all ,软件版本aix 5l ,等)Hacmp 5.2 + orcal 9i rac客户安装完hacmp 后,配置concurrent vg , 然后在上面创建lv ,最后启动hacmp 把concurrent vg varyon . 然后...显示全部
hacmp5.2 + orcal9i 创建控制文件 访问 lv 出错

     

环境:(产品hacmp ,平台pseries,机型all ,软件版本aix 5l ,等)
Hacmp 5.2 + orcal 9i rac


客户安装完hacmp 后,配置concurrent vg , 然后在上面创建lv ,最后启动hacmp 把concurrent vg varyon . 然后开始安装orcal ,但是在创建orcal 控制文件时,orcal 报错,说无法访问lv . 但是客户用dd 是可以读取lv 的。


客户在安装hacmp 时,有关rsct 的所有的包都选了,其中就包括pssp 控制软件。
如果orcal 监测到已经有pssp 存在后,创建控制文件时就不会去访问真正的lv ,而是
类似于vsd的设备,导致报错。找到pssp 相关的文件,并删除。收起
银行 · 2009-01-16
浏览1266
myciciymyciciy联盟成员IT顾问某金融科技公司
没有启用aio显示全部
没有启用aio收起
银行 · 2009-01-15
浏览1238
myciciymyciciy联盟成员IT顾问某金融科技公司
exec(): 0509-036 Cannot load program /sybase/ASE-12_0/bin/dataserver because of the following errors:0509-130 Symbol resolution failed for /usr/lib/libc.a[aio_64.o] because:0509-136 Symbol kaio_rdwr64 (number 0) is not exported fromdependent module /...显示全部
exec(): 0509-036 Cannot load prog
ram /sybase/ASE-12_0/bin/dataserver because of the following errors:
0509-130 Symbol resolution failed for /usr/lib/libc.a[aio_64.o] because:
0509-136 Symbol kaio_rdwr64 (number 0) is not exported from
dependent module /unix.
0509-136 Symbol listio64 (number 1) is not exported from
dependent module /unix.
0509-136 Symbol acancel64 (number 2) is not exported from
dependent module /unix.
0509-136 Symbol iosuspend64 (number 3) is not exported from
dependent module /unix.
0509-136 Symbol aio_nwait (number 4) is not exported from
dependent module /unix.
0509-150 Dependent module libc.a(aio_64.o) could not be loaded.
0509-026 System error: Cannot run a file that does not have a valid form
at.
0509-192 Examine .loader section symbols with the
'dump -Tv' command.
请问怎么解决!收起
银行 · 2009-01-15
浏览1240
myciciymyciciy联盟成员IT顾问某金融科技公司
今晚上客户那加班,再关HA时,发现SYBASE数据库没有完全停掉时,VG就被varyoff 了,这导致数据库异常,一些数据库进程被挂起.经修改HACMP的停止脚本,现已正常!!!修改的方法就是在关闭数据库命令的下行加入sleep 30,让HA在此处停留30秒,再进行下边的动作.呵呵,正常...显示全部
今晚上客户那加班,再关HA时,发现SYBASE数据库没有完全停掉时,VG就被varyoff 了,这导致数据库异常,一些数据库进程被挂起.经修改HACMP的停止脚本,现已正常!!!
修改的方法就是在关闭数据库命令的下行加入sleep 30,让HA在此处停留30秒,再进行下边的动作.呵呵,正常收起
银行 · 2009-01-14
浏览567
myciciymyciciy联盟成员IT顾问某金融科技公司
周一去客户那里巡检,用errpt一检查,考,NND,一大堆的ssa0 资源不可利用。凭偶的经验看,跟pdisk关系重大。做diag,报SRN:47500.检查了service guide。让重做阵列或者更换硬盘。有问题的阵列由2块pdisk盘做的raid1。和另外一个由2块pdisk盘做的raid1做成datavg。NND,用migratepv迁...显示全部
周一去客户那里巡检,用errpt一检查,考,NND,一大堆的ssa0 资源不可利用。凭偶的经验看,跟pdisk关系重大。做diag,报SRN:47500.
检查了service guide。让重做阵列或者更换硬盘。有问题的阵列由2块pdisk盘做的raid1。和另外一个由2块pdisk盘做的raid1做成datavg。NND,用migratepv迁移lv到好的raid1上的话,空间不够,只有回去,取盘。

2天后拿着ssa盘重回客户处,做vg备份,数据库备份。之后,什么lspv,lspv -l,看了看,做到对lv情况心中有数。然后做extendvg把自己带来的好盘扩到datavg里,migratepv把有问题的盘的lv迁移到好盘上。reducevg把坏盘删掉,进入smit ssaraid把有问题的阵列删掉,重新建raid1,把数据又迁移回来。把好盘用reducevg从datavg里删掉。至此,系统不再报错。收起
银行 · 2009-01-14
浏览584
myciciymyciciy联盟成员IT顾问某金融科技公司
问题已经得到解决,是双机的补丁没有打的缘故我的HACMP是5。1。0。0的打到5。1。0。4显示全部
问题已经得到解决,是双机的补丁没有打的缘故
我的HACMP是5。1。0。0的打到5。1。0。4收起
银行 · 2009-01-14
浏览558
myciciymyciciy联盟成员IT顾问某金融科技公司
HACMP启动非常慢,两台机器一起启动,主机需要等半个多小时才能启动,备机就根本启不来。查看/tmp/hacmp.out,没看到什么异常。事情经过是这样的:机器配置IBMP630+EMCCX500 采用AIX5.1ML06+HACMP5.1.0.1由于业务原因,要配置两种资源组,即采用concurrent+rotading组合方式,在配置的时...显示全部
HACMP启动非常慢,两台机器一起启动,主机需要等半个多小时才能启动,备机就根本启不来。查看/tmp/hacmp.out,没看到什么异常。
事情经过是这样的:
机器配置IBMP630+EMCCX500 采用AIX5.1ML06+HACMP5.1.0.1
由于业务原因,要配置两种资源组,即采用concurrent+rotading组合方式,
在配置的时候没什么问题,拓扑及资源组都同步成功。第一次启动双机也很正常。重起以后,切换也正常。
后来由于机器要挪动,所以把主机和阵列之间的光纤拔掉。恢复连接后,系统遇到无法识别VG的故障(是EMC的存储内部设置问题,后解决),之后我直接我安装JAVA1.4(按理说跟这应该没什么关系)。但每次HACMP启动都非常慢,两台机器一起启动,主机需要等半个多小时才能启动,备机就根本启不来。查看/tmp/hacmp.out,没看到什么异常。
我找不到其他原因,特向各位大虾求救。
跟HACMP补丁有没有关系?收起
银行 · 2009-01-14
浏览552
myciciymyciciy联盟成员IT顾问某金融科技公司
hacmp环境下更换磁带机1,主机A停HACMP集群服务并切换到备机,并确认 (smitty clstop, clstat)2,系统中删除磁带机设备 ( rmdev -dl rmt0)3,关闭主机A   (shutdown -F)4,卸载取出磁带机                ...显示全部
hacmp环境下更换磁带机
1,主机A停HACMP集群服务并切换到备机,并确认 (smitty clstop, clstat)
2,系统中删除磁带机设备 ( rmdev -dl rmt0)
3,关闭主机A   (shutdown -F)
4,卸载取出磁带机                  
5,启动机器A,重新切换回主机检查集群工作正常  (clstat)收起
银行 · 2009-01-13
浏览593

提问者

myciciy
IT顾问某金融科技公司
擅长领域: 服务器存储灾备

相关资料

问题状态

  • 发布时间:2008-12-30
  • 关注会员:0 人
  • 问题浏览:17885
  • 最近回答:2011-08-10
  • X社区推广