HACMP 切换后备机VG无法自动激活

平台:
主机:IBM P750    AIX6.1   
备机:IBM P550    AIX6.1   
存储:IBM V7000
数据库:ORACLE 11G      数据库安装在存储上       HA方式
做切换测试时,从主机切到备机,共享卷组无法激活,由于数据库是装在存储上的,所以数据库什么的当然也就无法启动了

但从备机切回到主机却一切正常,VG能正常挂载,数据库能正常启动

hacmp日志信息:



hacmp.out日志信息:
Jun  7 23:24:12 EVENT START: join_interface erp1 192.168.1.18

:join_interface[+57] [[ high = high ]]
:join_interface[+57] version=1.7.1.1
:join_interface[+58] :join_interface[+58] cl_get_path
HA_DIR=es
:join_interface[+60] [ 2 -ne 2 ]
:join_interface[+66] NODENAME=erp1
:join_interface[+67] ADDR=192.168.1.18
:join_interface[+68] BOOTIF=
:join_interface[+70] set -u
:join_interface[+71] [[ erp1 = erp1 ]]
:join_interface[+75] :join_interface[+75] clgetif -a 192.168.1.18
:join_interface[+75] LANG=C
BOOTIF=en2
:join_interface[+75] [[ -n en2  ]]
:join_interface[+78] cllsif -cSn 192.168.1.18
:join_interface[+78] cut -d: -f12
:join_interface[+79] read IF_ALIAS
:join_interface[+78] tr :  
:join_interface[+79] [[ -n  ]]
:join_interface[+93] :join_interface[+93] dspmsg scripts.cat 8064 Interface 192.168.1.18 is now available on node erp1.n 192.168.1.18 erp1
MSG=Interface 192.168.1.18 is now available on node erp1.
:join_interface[+94] echo Interface 192.168.1.18 is now available on node erp1.
:join_interface[+94] 1> /dev/console
:join_interface[+96] exit 0
Jun  7 23:24:13 EVENT COMPLETED: join_interface erp1 192.168.1.18 0

                        HACMP Event Summary
Event: TE_JOIN_ADAPTER
Start time: Fri Jun  7 23:24:12 2013

End time: Fri Jun  7 23:24:13 2013

Action:                Resource:                        Script Name:
----------------------------------------------------------------------------
No resources changed as a result of this event
----------------------------------------------------------------------------
以下图片是切换到备机后备机的状态:

QQ截图20130608095219.png

参与17

16同行回答

gwofgwof系统运维工程师IBM
先检查以下cluster.log,确认切换时候有无报错,再根据时间点到hacmp.out.x文件中看详细信息。hacmp.out.x问之前的hacmp.out文件,按时间先后问hacmp.out.1,hacmp.out.,。。。,hacmp.out.7显示全部
先检查以下cluster.log,确认切换时候有无报错,再根据时间点到hacmp.out.x文件中看详细信息。
hacmp.out.x问之前的hacmp.out文件,按时间先后问hacmp.out.1,hacmp.out.,。。。,hacmp.out.7收起
系统集成 · 2013-06-12
浏览2135
xindahaixindahai系统运维工程师耀泰明德
回复 5# lizza_2008     最好disable显示全部
回复 5# lizza_2008


    最好disable收起
系统集成 · 2013-06-08
浏览2136
lizza2008lizza2008软件开发工程师yotmid
回复 14# yink 很感谢你如此耐心详细的回答!这个HA采用的是active/standby方式# lspvhdisk0          00f860fc40ac80ab                    rootvg   &...显示全部
回复 14# yink

很感谢你如此耐心详细的回答!
这个HA采用的是active/standby方式
# lspv
hdisk0          00f860fc40ac80ab                    rootvg          active
hdisk1          00f860fc444aa646                    rootvg          active
hdisk2          00c55de66441cd0e                    newdatavg       active

# lsvg -l newdatavg
newdatavg:
LV NAME             TYPE       LPs     PPs     PVs  LV STATE      MOUNT POINT
loglv01             jfs2log    1       1       1    closed/syncd  N/A
new_oracleerplv     jfs2       1000    1000    1    closed/syncd  /oracleerp

现在无法收集更多的信息了,昨天操作的日志信息也忘了保存,这是从以前的日志里找的

手动varyonvg没有问题,只是要手动配一个服务IP,然后执行下启动脚本,数据库应用都正常

在切换之前是同步过HA信息的,所以这个应该没有问题收起
互联网服务 · 2013-06-08
浏览2218
yinkyink系统工程师by
楼主你应该描述一下你的HA环境:是RAC,还是active/standby顺便把lspv 和lsdev -Cc disk的信息列出来。还有hacmp的resource group信息也贴一下如果是rac模式,请注意下面这个参数:要启用多个节点对磁盘设备的同时访问,必须设置值取决于磁盘类型下, 表中列出相应的对象的数据管理...显示全部
楼主你应该描述一下你的HA环境:
是RAC,还是active/standby
顺便把lspv 和lsdev -Cc disk的信息列出来。
还有hacmp的resource group信息也贴一下

如果是rac模式,请注意下面这个参数:
要启用多个节点对磁盘设备的同时访问,必须设置值取决于磁盘类型下, 表中列出相应的对象的数据管理器 (ODM) 属性:
磁盘类型属性值
SSA, FAStT, or non-MPIO-capable disks
reserve_lock no
ESS, EMC, HDS, CLARiiON, or MPIO-capable disks
reserve_policy no_reserve
要确定该属性是否具有正确的值对于每个要使用的磁盘设备在所有群集节点上输入类似以下的命令:
# /usr/sbin/lsattr -El hdiskn
如果所需的属性未设置为正确的值的任何节点上,然后在该节点上输入类似以下的命令:
■ SSA 和 FAStT 设备
# /usr/sbin/chdev -l hdiskn -a reserve_lock=no
■ ESS、 EMC、 HDS、 CLARiiON,和 MPIO 能设备
# /usr/sbin/chdev -l hdiskn -a reserve_policy=no_reserve

如果是active/standby模式。
在A机上varyoffvg,然后B机上手工varyonvg,看看是否成功。

建议将HACMP停掉,然后同步一下HA信息,再启动HA试试。。收起
互联网服务 · 2013-06-08
浏览2150
lizza2008lizza2008软件开发工程师yotmid
我上传的附件怎么显示不了啊显示全部
我上传的附件怎么显示不了啊收起
互联网服务 · 2013-06-08
浏览2169
lizza2008lizza2008软件开发工程师yotmid
回复 10# 午夜幽魂 hacmp.out日志显示全部
回复 10# 午夜幽魂

hacmp.out日志


收起
互联网服务 · 2013-06-08
浏览2192
lizza2008lizza2008软件开发工程师yotmid
回复 9# zp_ccc 手工可以启备机,服务IP起不来(别名方式),手工添加服务IP,数据库应用都能用,但查看cluster状态时显示主备机资源组均为OFFLINE状态,而且主备机共享卷组都是ACTIVE显示全部
回复 9# zp_ccc

手工可以启备机,服务IP起不来(别名方式),手工添加服务IP,数据库应用都能用,但查看cluster状态时显示主备机资源组均为OFFLINE状态,而且主备机共享卷组都是ACTIVE收起
互联网服务 · 2013-06-08
浏览2793
午夜幽魂午夜幽魂系统运维工程师计算机有限公司
先把主机停了,在备机手工启动可以正常吗?errpt有什么报错,hacmp.out切换时的日志发出来看看,日志信息再给的全点显示全部
先把主机停了,在备机手工启动可以正常吗?errpt有什么报错,hacmp.out切换时的日志发出来看看,
日志信息再给的全点收起
系统集成 · 2013-06-08
浏览2841
zp_ccczp_ccc高级技术主管国内某金融科技公司
备机上收工可以激活卷组启动数据库吗显示全部
备机上收工可以激活卷组启动数据库吗收起
互联网服务 · 2013-06-08
浏览2733
bjibm1188bjibm1188系统工程师DCITS
回复 7# lizza_2008 你那收集的,太少了,你贴出来的,没看出一点错误信息。你可以用SecureCRT的log session功能来收集,单独建个connect,然后tail -f ***/hacmp.out这样,可以收集到全部信息。显示全部
回复 7# lizza_2008
你那收集的,太少了,你贴出来的,没看出一点错误信息。你可以用SecureCRT的log session功能来收集,单独建个connect,然后tail -f ***/hacmp.out这样,可以收集到全部信息。收起
互联网服务 · 2013-06-08
浏览2790

提问者

lizza2008
软件开发工程师yotmid

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2013-06-08
  • 关注会员:1 人
  • 问题浏览:15240
  • 最近回答:2013-06-12
  • X社区推广