硬件生产HA

HA问题,大家帮忙下,,急

今天遇到了一个HA停止的问题:当停止HA时候,一个节点的HA进程停止了,另一个节点的HA进程还在.
先说下环境,2台P740做了HA,应用是SAP.
操作系统AIX6100-06-08-1216   HA版本:6.1sp09
配置完成HA后,空脚本执行启动和停止HA都没有问题,
然后再用命令启动应用(DB2和SAP,这里用脚本执行,但资源组里的脚本还是空脚本),启动和停止HA仍然没有问题

现在情况,在资源组里的脚本加上上面测试的脚本,启动没有问题,但是停止的时候,一个节点A的HA进程都停了,
但是B节点的HA还在,如下图,不知道什么问题麻烦大家帮忙解决下.
停止HA后,HA进程应该如下图:inoperative状态,但是另一个节点的状态还是active

clstart.png


另一个B节点的HA关闭不了,

clstop.png




以下是hacmp.out的一些log
:cl_sel[148] ls -rt1 /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.16.06.Z /tmp/ibmsupt/hacmp/event
logs.2012.10.10.16.11.Z /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.17.20.Z /tmp/ibmsupt/hacmp/ev
entlogs.2012.10.10.17.26.Z /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.21.55.Z /tmp/ibmsupt/hacmp
/eventlogs.2012.10.10.22.01.Z
:cl_sel[148] FFDC_LIST=/tmp/ibmsupt/hacmp/eventlogs.2012.10.10.16.06.Z
:cl_sel[151] rm -f /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.16.06.Z
:cl_sel[155] dspmsg scripts.cat 10059 'FFDC event log collection saved to /tmp/ibmsupt/hacmp/
eventlogs.2012.10.10.22.01n' /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.22.01
FFDC event log collection saved to /tmp/ibmsupt/hacmp/eventlogs.2012.10.10.22.01
:cl_sel[157] exit 0
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 360 seconds.
Please check cluster status.
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 390 seconds.
Please check cluster status.
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 420 seconds.
Please check cluster status.
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 450 seconds.
Please check cluster status.
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 480 seconds.
Please check cluster status.
WARNING: Cluster sapcluster has been running recovery program 'TE_FAIL_NODE' for 540 seconds.
Please check cluster status.



加入现在要重新启动HA的话,报了ha的进程还在
Command: failed        stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

Verifying Cluster Configuration Prior to Starting Cluster Services.
WARNING: Node(s):  prd1 requested to start cluster services.
These nodes are already running cluster services and will not be started.


麻烦大家帮忙下.....................
参与15

14同行回答

yyt609yyt609系统运维工程师宁波国研软件技术有限公司
我是来偷师学经验的!显示全部
我是来偷师学经验的!收起
系统集成 · 2012-10-29
浏览2646
gwofgwof系统运维工程师IBM
停止脚本返回值不为零。也就是说停止脚本执行有问题。显示全部
停止脚本返回值不为零。也就是说停止脚本执行有问题。收起
系统集成 · 2012-10-16
浏览2596
我也遇到类似的情况,脚本问题显示全部
我也遇到类似的情况,脚本问题收起
零售/批发 · 2012-10-16
浏览2576
amote0201amote0201技术支持XX科技XX
以前遇到过,应用数据库都停了,HA还是卡在这里,后面重启主机就没问题了,不知道是哪的原因,切换几次就这 ...午夜幽魂 发表于 2012-10-15 22:24 应该有具体的原因,没人愿意天天重启小型机!...显示全部
以前遇到过,应用数据库都停了,HA还是卡在这里,后面重启主机就没问题了,不知道是哪的原因,切换几次就这 ...
午夜幽魂 发表于 2012-10-15 22:24



应该有具体的原因,没人愿意天天重启小型机!收起
金融其它 · 2012-10-16
浏览2740
午夜幽魂午夜幽魂系统运维工程师计算机有限公司
以前遇到过,应用数据库都停了,HA还是卡在这里,后面重启主机就没问题了,不知道是哪的原因,切换几次就这样,就必须重启主机显示全部
以前遇到过,应用数据库都停了,HA还是卡在这里,后面重启主机就没问题了,不知道是哪的原因,切换几次就这样,就必须重启主机收起
系统集成 · 2012-10-15
浏览4096
smallmiaosmallmiao存储工程师MacroSAN
问题解决了 是脚本问题在脚本后面加上exit 0 就行了显示全部
问题解决了 是脚本问题
在脚本后面加上exit 0 就行了收起
硬件生产 · 2012-10-12
浏览4154
yukay2010yukay2010系统工程师神州数码系统集成服务有限公司
脚本有问题,检查脚本显示全部
脚本有问题,检查脚本收起
系统集成 · 2012-10-11
浏览4087
cclljiancclljian系统工程师ygnet
这种现象,我此前也遇到过,是起停脚本的问题——应用没关掉、ha也关关闭不了。所以检查一下脚本。显示全部
这种现象,我此前也遇到过,是起停脚本的问题——应用没关掉、ha也关关闭不了。所以检查一下脚本。收起
系统集成 · 2012-10-11
浏览4056
天生杀人猫天生杀人猫系统运维工程师联通系统集成有限公司
检查一下启停应用和数据库的脚本是否能正常运行。还有检查一下宿主及权限有没有问题。显示全部
检查一下启停应用和数据库的脚本是否能正常运行。还有检查一下宿主及权限有没有问题。收起
系统集成 · 2012-10-11
浏览4141
jim567jim567系统架构师上海天玑科技股份有限公司
停止应用-停止数据库-查看脚本的权限(HA当中脚本权限755)两边节点的脚本内容以及路径是否正确-同步HA查看同步信息。显示全部
停止应用-停止数据库-查看脚本的权限(HA当中脚本权限755)两边节点的脚本内容以及路径是否正确-同步HA查看同步信息。收起
互联网服务 · 2012-10-11
浏览4347

提问者

smallmiao
存储工程师MacroSAN
擅长领域: 存储备份服务器

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2012-10-10
  • 关注会员:1 人
  • 问题浏览:18146
  • 最近回答:2012-10-29
  • X社区推广