PowerHA脑裂
PowerHA脑裂
在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果——或者共享资源被瓜分、2边“服务”都起不来了;或者2边“服务”都起来了,但同时读写“共享存储”,导致数据损坏...(more)
在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果——或者共享资源被瓜分、2边“服务”都起不来了;或者2边“服务”都起来了,但同时读写“共享存储”,导致数据损坏

问题

系统集成PowerHA·2016-08-23
关于powerHA7.1的配置问题1、关于心跳:官方推荐是配置ip、fc、repository disk心跳,但是看到很多兄弟配置的时候并未配置fc心跳,这样是否存在引发脑裂的风险;2、关于使用非IBM存储做共享卷时,配置custom disk methods时,是否与HA6.1一样。...(more)
浏览2585
系统集成PowerHA·2016-05-11
hong2611 · 北京银信长远科技股份有限公司 擅长领域:服务器, 系统管理, 脑裂
41 会员关注
1、什么叫vlpar?  指VIOS下的LPAR2、HA版本是6.1.0.11,建议更新到最新的补丁版本。SP11应该比较老的补丁了,有问题也正常。3、检查心跳磁盘路径状态。拔掉一台主机的2根网线后,检查没关那台主机的心跳磁盘的路径状态。4、整个测试过程中全程不停ping关联IP地址-t,...
系统集成资源组·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
从输出上看,资源组是在切换到另一个节点的过程中,这个时间可以看hacmp.out和cluster.log是否正常
银行PowerHA·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
出现脑裂之后应该会中断的,资源不停的来回切换,机器不会宕机
互联网服务脑裂·2016-01-06
hello_unix · 西安 擅长领域:服务器, 存储, 灾备
135 会员关注
关于脑裂,补充一些基础知识,供大家学习参考:在“双机热备”高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障,2个节点上的HA软件像“裂脑人”一样,“本能”地争抢“共享资源”...
互联网服务脑裂·2016-01-06
hello_unix · 西安 擅长领域:服务器, 存储, 灾备
135 会员关注
脑裂发生,其实就是HACMP故障的一种,一般情况下,HACMP出故障了,不建议在生产时间来修理HACMP问题,第一步:赶紧把HACMP停掉(此时,有可能需要重启某台机器),把资源都释放掉。第二步:手动把vg和文件系统都挂在起来第三步:配置service IP地址(ifconfig eth0 1.1.1.X alias)第四步:执行业务启...
银行HA·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
hacmp中,共享存储设置看是看你连接什么型号的存储,不同的存储有不同的设置SSA and FAStT devices# /usr/sbin/chdev -l hdiskn -a reserve_lock=no■ ESS, EMC, HDS, CLARiiON, and MPIO-capable devices# /usr/sbin/chdev -l hdiskn -a reserve_policy=no_reserve这个在做...
银行PowerHA·2016-01-06
爱如潮水 · 四川农信 擅长领域:服务器, 存储, 灾备
88 会员关注
1、遵循厂商要求,按标准化的配置规范进行HA的设计实施2、日常监控中,对HA的各种运行日志进行检查
银行HA·2016-01-06
fly0176 · 新明星 擅长领域:服务器, 系统管理, 存储
31 会员关注
在心跳失效的时候,就发生了split-brain。比如: 正常情况下,NodeA和NodeB在心跳检测以确认对方存在; 在通过心跳检测不到对方时,就接管对应的resource。 如果突然间,NodeA和NodeB之间的心跳不存在了,而NodeA和NodeB事实上都active,这时NodeA要接管NodeB的resource么? 而同时NodeB要...
互联网服务脑裂·2016-01-05
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
从几个方面考虑1、系统补丁,hamcp的补丁,在系统安装后一般要对系统进行补丁升级,包括hacmp也是2.规划这里面包含很多,一是ip规划,采用哪种方式是别名。替代还是etherchannel,现在用etherchannel的方式比较多,二是心跳方式,是磁盘还是网络还是串口,三是资源组规划,,策略规划以及相应...

描述

在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果——或者共享资源被瓜分、2边“服务”都起不来了;或者2边“服务”都起来了,但同时读写“共享存储”,导致数据损坏...(more)
在高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样,争抢“共享资源”、争起“应用服务”,就会发生严重后果——或者共享资源被瓜分、2边“服务”都起不来了;或者2边“服务”都起来了,但同时读写“共享存储”,导致数据损坏
X社区推广
  • 提问题