IT分销/经销故障诊断数据库 Oracle 系统维护 aix 6.1

aix心跳中断导致一个节点重启

两台IBM 780小型机，上面安装了aix 6.1+oracle 11g，两个节点做 rac。两个节点之间的心跳通讯通过虚拟网卡ent13（由每个分区上不同柜子的ent9和ent11网卡聚合而成，其中两个ent9连在内部的光纤交换机上作为主线路，备用线路为通过两个ent11口直连）连接实现。故障：通过errpt查看，B节点...显示全部

参与32

查看其它 29 个回答phanx的回答

phanx系统工程师银行

回复 1# tttzzz22

你想啊，其中一个节点网口ent9 down掉以后，ent13的Active member变成了eth11，数据从ent11往外发送，但是对端节点 ent9是好的，所以仍然是ent9作为Active Member在接收数据。但ent11是网线直连的，怎么可能收到从节点1的ent11到节点2的ent9的数据包呢？这个必须通过交换机，让两个节点的ent9和ent11 这四个口子在同一个VLAN下才能够做到啊。

这次生产故障完全应该由负责实施部署RAC的人负责。什么技术人员说“不太建议”，完全是不负责任，或者是该技术人员也没有弄清楚RAC对于心跳网络Failover的机制，这种依赖OS的网卡Failover方案，必须通过交换机。

系统上线前没做故障测试吧，做了的话肯定不会这样。

补充一下： 10gR2/11gR1 RAC的心跳网络是这个样子，11gR2 RAC新的网络心跳是用的HAIP来实现的，不依赖OS级别的网卡Failover了，又不一样了。如果楼主的版本是11gR2的话，那么还是做RAC方案的人没有用HAIP。

银行 · 2014-07-02

浏览1523

回答者

系统工程师银行

擅长领域：服务器，数据库，AIX

评论162

phanx 最近回答过的问题

在做容器化应用时，是否要指定宿主机上的容器应用权限，避免root权限运行？

一个关于IP路由转向的问题

单节点故障问题如何解决，操作步骤和流程如何？

金融行业应用中，是否有需要独占资源的重要子系统或者模块？这部分系统和资源池化后的其他系统如何交互？

关于SDN规划设计方案、实施部署过程当中，有没一些经验值得借鉴？

回答状态

发布时间：2014-07-02

关注会员：2 人

回答浏览：1523

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广