求助Redhat系统HA(RHCS)的服务切换问题!

刚做的redhat HA系统,Red Hat EnterpriseLinux 6.5 64位+Red Hat Cluster Suite,实现双机。正常在两个节点间切换服务,ok。重启节点服务也可以正常切换的另一节点,如图。

01.jpg

01.jpg






而在正启用服务节点上做down网卡的操作后,此节点重启。但另一节点服务不能切换。只有当重启的节点启动成功后,在能启动服务。

02.jpg


在service group的recoery plicy(恢复策略)我选的是relocate。后改成restart也是如此。



参与18

13同行回答

tong2012tong2012系统工程师中国航空
回复 4# jacky_cshy 是的,也就是说内部fence下,一个节点彻底坏了,就像有些客户讲的,如果用个铁锤一下把A节点砸烂了,无法做任何的加电工作了,那么RHCS是无法自动从A节点切到B节点的,这个案例我去年跟客户纠缠了好久,也找redhat 800确认过了;这个是rhcs的特点,再加个外部fence才能...显示全部
回复 4# jacky_cshy


是的,也就是说内部fence下,一个节点彻底坏了,就像有些客户讲的,如果用个铁锤一下把A节点砸烂了,无法做任何的加电工作了,那么RHCS是无法自动从A节点切到B节点的,这个案例我去年跟客户纠缠了好久,也找redhat 800确认过了;
这个是rhcs的特点,再加个外部fence才能支持这种一个节点彻底坏掉的情况; 不过一般情况下,只要坏掉的节点还能加电,信号还能传过去,HA就会自动切过去。收起
系统集成 · 2015-04-10
浏览8576
DerekgaoDerekgao系统架构师CSLC
fence配了吗? 网卡端,两边机器不能判断是谁坏了,需要除了网卡以外的判断机制.显示全部
fence配了吗? 网卡端,两边机器不能判断是谁坏了,需要除了网卡以外的判断机制.收起
系统集成 · 2015-04-09
浏览6258
tong2012tong2012系统工程师中国航空
你这个RHCS 用的是内部fence , 做双激情切换测试就是这种状态,有问题的那台主机必须是加电后,服务才能切过去;也就是说 内部fence的情况下,是不支持关电源、拔电源线这种测试方法的;想支持这种测试方法,需要配置外部fence。...显示全部
你这个RHCS 用的是内部fence , 做双激情切换测试就是这种状态,有问题的那台主机必须是加电后,服务才能切过去;也就是说 内部fence的情况下,是不支持关电源、拔电源线这种测试方法的;想支持这种测试方法,需要配置外部fence。收起
系统集成 · 2015-04-09
浏览6129
gzhzzzggzhzzzg项目经理天地
  请问你这个问题解决了吗?我现在也遇到这个问题,是DELL的服务器,断掉网卡就自动重启,双机无法切换,必须等服务器启动后才能切换资源,差不多要10分钟显示全部

  请问你这个问题解决了吗?我现在也遇到这个问题,是DELL的服务器,断掉网卡就自动重启,双机无法切换,必须等服务器启动后才能切换资源,差不多要10分钟

收起
系统集成 · 2016-10-25
浏览4807
zhangzr1979zhangzr1979软件开发工程师信云信阳
PCserver 需要外部的fence显示全部
PCserver 需要外部的fence收起
互联网服务 · 2015-04-18
浏览4858
jacky_cshyjacky_cshy存储工程师huasheng
再顶一下,求解显示全部
再顶一下,求解收起
系统集成 · 2015-04-16
浏览4879
jacky_cshyjacky_cshy存储工程师huasheng
没人知道吗?各位求助显示全部
没人知道吗?各位求助收起
系统集成 · 2015-04-14
浏览8447
jacky_cshyjacky_cshy存储工程师huasheng
我现在测试ipmitool是没问题的,ipmitool对方power reset,都可以成功。qdisk也正常。问什么当掉外部网卡,服务切不过去。我的心跳是192网段,ipmi是10网段的,不在一网段,有关系吗?还有一点,我在两节点用的的网线直接连接的,没通过交换机,有关系吗...显示全部
我现在测试ipmitool是没问题的,ipmitool对方power reset,都可以成功。qdisk也正常。问什么当掉外部网卡,服务切不过去。我的心跳是192网段,ipmi是10网段的,不在一网段,有关系吗?
还有一点,我在两节点用的的网线直接连接的,没通过交换机,有关系吗收起
系统集成 · 2015-04-13
浏览8441
jacky_cshyjacky_cshy存储工程师huasheng
回复  jacky_cshy     拔业务网线,看能不能fence掉对方。tong2012 发表于 2015-4-10 18:19 拔网线和down不同吗?请问,为什么我down网卡后,机器会自动重启呢?是RHCS的设置问题?能设置不重启吗?...显示全部
回复  jacky_cshy


    拔业务网线,看能不能fence掉对方。
tong2012 发表于 2015-4-10 18:19


拔网线和down不同吗?请问,为什么我down网卡后,机器会自动重启呢?是RHCS的设置问题?能设置不重启吗?收起
系统集成 · 2015-04-11
浏览8472
jacky_cshyjacky_cshy存储工程师huasheng
回复  jacky_cshy 是的,也就是说内部fence下,一个节点彻底坏了,就像有些客户讲的,如果用个铁锤一下 ...tong2012 发表于 2015-4-10 18:16 fence设置方法是什么? 我将节点A和B的BMC的ipmi的ip和密码已经都在bios中设置好。在RHCS的fence devices中分别加了2个ipmi ...显示全部
回复  jacky_cshy


是的,也就是说内部fence下,一个节点彻底坏了,就像有些客户讲的,如果用个铁锤一下 ...
tong2012 发表于 2015-4-10 18:16


fence设置方法是什么? 我将节点A和B的BMC的ipmi的ip和密码已经都在bios中设置好。在RHCS的fence devices中分别加了2个ipmi lan设备01和02.
01设备对应的是节点A的ip和密码。02对应的节点B的账号密码和ip。然后在nodes标记中将fence设备的01关联到节点A,设备02关联的节点B。这样的fence设置对吗?怎么能验证我的fence设备是不是有效呢?
一下是我的设置截图,请帮忙看看。

h10.jpg

h01.jpg

h02.jpg

h03.jpg

h04.jpg

h05.jpg

h06.jpg

h07.jpg

h08.jpg

h09.jpg

收起
系统集成 · 2015-04-11
浏览8567

提问者

jacky_cshy
存储工程师huasheng
擅长领域: 服务器AIXUnix

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-04-09
  • 关注会员:2 人
  • 问题浏览:20153
  • 最近回答:2016-10-25
  • X社区推广