主机A和B组成的RHCS的集群,使用fence_scsi作为fence方法。
当主机A的心跳异常后(测试时拔掉了主机A的心跳线),此时主机B会将主机A fence掉。
但是之后主机A会自动重启,我想问,这个主机A的重启是谁触发的,谁给主机A下的命令呢?
建议不要使用fence_scsi作为fence方法,RHCS最可靠的fence机制就是电源fence
fence_scsi的主要问题就是当VIP的接管问题,比如如果A是当前Active,A心跳线断开,B会执行fence,获得存储lun的控制权(通过tag的方式)并接管业务(包括VIP),A由于失去LUN上的tag,导致无法对LUN进行读写操作(相当于存储链路断开),但是这时候,A机不会自动释放VIP,到时业务网中就会有2个相同的VIP。
你的环境中,A机重启应该是启用了Qdisk,Qdisk我记得有个参数,是配置当qdisk失去的时候,是否重启自己。 你可以man cluster.conf, man qdisk 看看
收起