IT咨询服务PowerHAaix 6.1

HACMP 网络测试疑问?

环境为AIX 6100-06-03-1048,HACMP 6.1 SP17两个节点搭建的HACMP测试环境,每个节点上两个网卡,hosts文件如下10.10.10.181 LPAR1_boot LPAR110.10.10.182 LPAR2_boot LPAR2 10.7.7.181 LPAR1_standby LPAR110.7.7.182 LPAR2_standby LPAR210.7.2....显示全部

环境为AIX 6100-06-03-1048,HACMP 6.1 SP17
两个节点搭建的HACMP测试环境,每个节点上两个网卡,
hosts文件如下
10.10.10.181 LPAR1_boot LPAR1
10.10.10.182 LPAR2_boot LPAR2
10.7.7.181 LPAR1_standby LPAR1
10.7.7.182 LPAR2_standby LPAR2
10.7.2.181 LPAR1_per
10.7.2.182 LPAR2_per
10.7.2.180 oradb
LPAR1上网卡信息如下:

ifconfig -a|more

en0: flags=1e084863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),LARGESEND,CH
AIN>

    inet 10.10.10.181 netmask 0xffffff00 broadcast 10.10.10.255
    inet 10.7.2.181 netmask 0xffffff00 broadcast 10.7.2.255
     tcp_sendspace 131072 tcp_recvspace 65536 rfc1323 0

en1: flags=1e084863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),LARGESEND,CH
AIN>

    inet 10.7.7.181 netmask 0xffffff00 broadcast 10.7.7.255
    inet 10.7.2.180 netmask 0xffffff00 broadcast 10.7.2.255
     tcp_sendspace 131072 tcp_recvspace 65536 rfc1323 0

lo0: flags=e08084b,c0<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,LARGESEND,CHAIN>

    inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255
    inet6 ::1%1/0
     tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1
     

节点间切换和资源组切换测试都正常,唯一在进行网卡测试时发现一个现象:
运行ifconfig en1 down模拟en1网卡故障
可以看到

ifconfig -a|more

en0: flags=1e084863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),LARGESEND,CH
AIN>

    inet 10.10.10.181 netmask 0xffffff00 broadcast 10.10.10.255
    inet 10.7.2.181 netmask 0xffffff00 broadcast 10.7.2.255
    inet 10.7.2.180 netmask 0xffffff00 broadcast 10.7.2.255
     tcp_sendspace 131072 tcp_recvspace 65536 rfc1323 0

en1: flags=1e084862,c0<BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),LARGESEND,CHAIN

    inet 10.7.7.181 netmask 0xffffff00 broadcast 10.7.7.255
     tcp_sendspace 131072 tcp_recvspace 65536 rfc1323 0

lo0: flags=e08084b,c0<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,LARGESEND,CHAIN>

    inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255
    inet6 ::1%1/0
     tcp_sendspace 131072 tcp_rec

可以看到service ip切换到en0上,正常
但是这个时候,在不恢复en1的情况下,再ifconfig en0 down,模拟en0的故障:
这个时候发现两个节点都会自动关闭
由于这个环境是将一台小型机上创建两个LPAR搭建出来的,所以不清楚真实的环境,遇到en1,en0都故障时,也会发生这种情况吗?有点不明白,为什么会自动关机呢?

在网上看到有一位外国人说了这么一段话(地址:https://www.experts-exchange.com/questions/26763773/how-to-bring-NIC-down-on-aix-server.html)
Bringing down a service interface the above described way will force a resource group failover, and bringing down the heartbeat interfaces that way will trigger the Dead Man Switch, so the affected node will be halted immediately!
貌似是这个情况,但是又不太一样,按理说,这个时候我还有一个磁盘心跳是正常的,两节点之间能相互检测到状态啊,求大神解惑

收起
参与10

查看其它 2 个回答mxin辛旻的回答

mxin辛旻mxin辛旻  资深工程师 , 上海宝信软件股份有限公司

的确不符合预期,正确的情形请参见我的博客相关hacmp测试报告。

IT咨询服务 · 2018-02-08
浏览1862

回答者

mxin辛旻
资深工程师上海宝信软件股份有限公司
擅长领域: 存储灾备服务器

mxin辛旻 最近回答过的问题

回答状态

  • 发布时间:2018-02-08
  • 关注会员:4 人
  • 回答浏览:1862
  • X社区推广