aix心跳中断导致一个节点重启

两台IBM 780小型机,上面安装了aix 6.1+oracle 11g,两个节点做 rac。两个节点之间的心跳通讯通过虚拟网卡ent13(由每个分区上不同柜子的ent9和ent11网卡聚合而成,其中两个ent9连在内部的光纤交换机上作为主线路,备用线路为通过两个ent11口直连)连接实现。故障:通过errpt查看,B节点...显示全部
两台IBM 780小型机,上面安装了aix 6.1+oracle 11g,两个节点做 rac。两个节点之间的心跳通讯通过虚拟网卡ent13(由每个分区上不同柜子的ent9和ent11网卡聚合而成,其中两个ent9连在内部的光纤交换机上作为主线路,备用线路为通过两个ent11口直连)连接实现。故障:通过errpt查看,B节点报hba2(对应ent11口) down,然后报 ETHERCHANNEL CAN NOT FAIL OVER,A节点的数据库日志*alert.log提示通讯中断,开始倒计时,然后A节点就自动重启了

请各位帮忙分析一下?收起
参与32

查看其它 29 个回答tttzzz22的回答

tttzzz22tttzzz22QA工程师安徽合肥
回复 27# phanx


    从测试的情况看,在拔出某个端口的光纤之前,在对端执行ping命令。在拔出之后,可以看到ping不通,过了一段时间之后,又通了,使用netstat -v ent13查看,此时激活的端口确实变化了,由primary变为backup或者backup变为primary

操作系统层面,两端的ent13都是同样的配置,做etherchannel,主端口为ent9,备用端口为ent11。ping3次,每次的超时时间是一秒,如果不通就进行切换。
IT分销/经销 · 2014-07-24
浏览2702

回答者

tttzzz22
QA工程师安徽合肥
擅长领域: 系统运维云计算大数据

tttzzz22 最近回答过的问题

回答状态

  • 发布时间:2014-07-24
  • 关注会员:2 人
  • 回答浏览:2702
  • X社区推广