金融其它rhcs不能切换

RHCS双机不能切换,message显示fence对方节点失败。

2 台cisco ucs210,RHES5.5,fence设备用的cisco CIMC接口,配置集群时采用的ipmilan模式。

集群可正常启动,且:用fence_ipmilan命令可获得另一集群的状态并能重启对方节点;

但是,A节点down机(shutdown 或拔断A机的网线),资源(fs和service_ip)不能切换至B节点,查看messages显示fence "NODE_B“ falied。


请各之需要的日志,我在传上来。

谢谢!
参与23

22同行回答

tong2012tong2012系统工程师中国航空
Member Name                            ID   Status------ ----                    &nbs...显示全部
Member Name                            ID   Status
------ ----                            ---- ------
A                             1     offline


这里的A 节点的offline 后面没有rgmanager了,这种状态已经不正常了;

最有效的办法,就是debug一下了,步骤为:

确保双机是关闭了,主备节点中共享资源都是offline的,共享卷组必须是非激活的,浮动地址没有被手工添加到主机上;
保证主备机上,cman和rgmanager都是running 状态;

在出问题的节点上用root用户执行下面的命令:
rg_test test /etc/cluster/cluster.conf  start webservice

可以看到debug的过程,共享资源和浮动地址会被挂载起来,HA状态就正常了。收起
系统集成 · 2015-04-09
浏览3320
tong2012tong2012系统工程师中国航空
目前问题解决了没有?显示全部
目前问题解决了没有?收起
系统集成 · 2015-04-09
浏览3078
热心冰块热心冰块项目经理浪潮INSPUR
Cluster组件是不输入序列号安装时不显示,不过在OS安装完成后可以手动添加安装源显示全部
Cluster组件是不输入序列号安装时不显示,不过在OS安装完成后可以手动添加安装源收起
系统集成 · 2012-07-03
浏览3264
feidaodaofeidaodao系统运维工程师GA
不用序列号吧?mophis 发表于 2012-7-2 16:39 可跳过:lol显示全部
不用序列号吧?
mophis 发表于 2012-7-2 16:39



可跳过:lol收起
金融其它 · 2012-07-02
浏览3261
mophismophis软件开发工程师杭州
红帽的cluster组件,在系统安装的时候好像是要序列号的爱如潮水 发表于 2012-2-29 15:29 不用序列号吧?显示全部
红帽的cluster组件,在系统安装的时候好像是要序列号的
爱如潮水 发表于 2012-2-29 15:29

不用序列号吧?收起
互联网服务 · 2012-07-02
浏览3238
feidaodaofeidaodao系统运维工程师GA
经过多次测试和验证,已经确定是客户脚本问题造成的现象。显示全部
经过多次测试和验证,已经确定是客户脚本问题造成的现象。收起
金融其它 · 2012-07-02
浏览3202
feidaodaofeidaodao系统运维工程师GA
当前的群集切换判断有问题. 正常的话,应该是A机断掉网线后,B机会将A机 fence掉 1)用户最近有没有做网 ...爱如潮水 发表于 2012-3-2 17:37 是在A机断掉网线,但是b机不能fenced掉A机在B节点的messages中显示,fenced nodeA failed,但是fence_ipmilan可以获得A机的状态,并能重启A...显示全部
当前的群集切换判断有问题. 正常的话,应该是A机断掉网线后,B机会将A机 fence掉
1)用户最近有没有做网 ...
爱如潮水 发表于 2012-3-2 17:37



是在A机断掉网线,但是b机不能fenced掉A机

在B节点的messages中显示,fenced nodeA failed,但是fence_ipmilan可以获得A机的状态,并能重启A节点。收起
金融其它 · 2012-03-02
浏览3426
爱如潮水爱如潮水研发工程师四川农信
不好意思,潮水老大及各位热心朋友。在不同楼层的描述可能带来歧义,对不住了。1)……手工shutdown A机 ...feidaodao 发表于 2012-3-1 15:25 当前的群集切换判断有问题. 正常的话,应该是A机断掉网线后,B机会将A机 fence掉 1)用户最近有没有做网络改造或者在系统层面的调整? 2)...显示全部
不好意思,潮水老大及各位热心朋友。在不同楼层的描述可能带来歧义,对不住了。

1)……手工shutdown A机 ...
feidaodao 发表于 2012-3-1 15:25



当前的群集切换判断有问题. 正常的话,应该是A机断掉网线后,B机会将A机 fence掉
1)用户最近有没有做网络改造或者在系统层面的调整?
2)切换时,群集的日志里有无明显异常内容?收起
金融其它 · 2012-03-02
浏览3220
feidaodaofeidaodao系统运维工程师GA
1)……手工shutdown A机,资源可以切换至B机的……2)……但是,A节点down机(shutdown 或拔断A机的网线) ...爱如潮水 发表于 2012-3-1 12:37 不好意思,潮水老大及各位热心朋友。在不同楼层的描述可能带来歧义,对不住了。1)……手工shutdown A机,资源可以切换至B机的……这是我在...显示全部
1)……手工shutdown A机,资源可以切换至B机的……
2)……但是,A节点down机(shutdown 或拔断A机的网线) ...
爱如潮水 发表于 2012-3-1 12:37


不好意思,潮水老大及各位热心朋友。在不同楼层的描述可能带来歧义,对不住了。

1)……手工shutdown A机,资源可以切换至B机的……
这是我在未离开现场时,做的测试及测试结果。的确可以模拟A机DOWN机,资源能够正常切换至B节点。


2)……但是,A节点down机(shutdown 或拔断A机的网线),资源(fs和service_ip)不能切换至B节点……   
这是当前的cluster的状态,已交付客户有3个月了,客户来电告之cluster有问题

当前cluster能够启动,也互相fenced状态都正常,而且也能reboot对方节点

[root@A ~]# fence_ipmilan -v -P -a 10.10.10.23 -l admin -p password -o status -A password
Getting status of IPMI:10.10.10.23...Spawning: '/usr/bin/ipmitool -I lanplus -H '10.10.10.2' -U 'admin' -A 'password' -P 'password' -v chassis power status'...
Chassis power = On
Done

但:
1> 但是shutdown 一个节点,资源不能切换至另一个节点

2> 拔掉一个节点的网线,不能切换,在messages里显示fence 对方节点 failed。
在OS上看到的clustat是
[root@A ~]# clustat
Cluster Status for appcls @ Fri Jan 13 13:07:15 2012
Member Status: Quorate

Member Name                            ID   Status
------ ----                            ---- ------
A                             1     offline
B                              2    Online, rgmanager

Service Name                  Owner (Last)                  State         
------- ----                  ----- ------                  -----         
service:webservice           A                 started

查看messages显示fence "NODE_B“ falied。收起
金融其它 · 2012-03-01
浏览3330
爱如潮水爱如潮水研发工程师四川农信
好的,我后面测试一下。当时手工shutdown A机,资源可以切换至B机的。出问题后我看了一下cluster.co ...feidaodao 发表于 2012-2-29 21:05 1)……手工shutdown A机,资源可以切换至B机的……2)……但是,A节点down机(shutdown 或拔断A机的网线),资源(fs和service_ip)不能切换至B节...显示全部
好的,我后面测试一下。

当时手工shutdown A机,资源可以切换至B机的。

出问题后我看了一下cluster.co ...
feidaodao 发表于 2012-2-29 21:05

1)……手工shutdown A机,资源可以切换至B机的……
2)……但是,A节点down机(shutdown 或拔断A机的网线),资源(fs和service_ip)不能切换至B节点……
shutdown双机切换就正常,拔网线双机切换就不正常?收起
金融其它 · 2012-03-01
浏览3257

提问者

feidaodao
系统运维工程师GA
擅长领域: 灾备存储服务器

问题状态

  • 发布时间:2012-02-28
  • 关注会员:1 人
  • 问题浏览:26833
  • 最近回答:2015-04-09
  • X社区推广