案例1 AIX 安全加固惹出大麻烦,生产系统停止服务

某一天用户打电话过来说,业务突然中断了,让我们赶紧过来帮忙处理一下。到了现场用户那里乱成一团,主机,网络,存储,数据库,业务上都在检查各自的问题。经查发现是RAC挂了,DBA通过检查日志发现是脑裂导致的,究其原因网络心跳异常导致的,网络管理员检查网络也没有问题。最后问到近期有...显示全部

某一天用户打电话过来说,业务突然中断了,让我们赶紧过来帮忙处理一下。到了现场用户那里乱成一团,主机,网络,存储,数据库,业务上都在检查各自的问题。经查发现是RAC挂了,DBA通过检查日志发现是脑裂导致的,究其原因网络心跳异常导致的,网络管理员检查网络也没有问题。最后问到近期有没有做过变更,运维管理员说:应集团和上级指示要求风险管理部昨天下发安全风险整改文件,要求我们实施部署了安全加固。昨天晚上在我们的生产环境进行了安全加固。一看里面的内容发现,有一条最为关键,AIX 进行了IP Security 。就是这样这个安全策略才导致RAC心跳通讯中断,发生了脑裂,进而业务不能正常运行。最后赶紧的取消了这个策略,业务正常运行。

收起
参与28

查看其它 6 个回答myciciy的回答

myciciymyciciyIT顾问某金融科技公司

周末陆续补充其他案例..........................................

银行 · 2016-11-25
浏览2614
  • 可以理解为:防止脑裂,单/双节点重启,一般不会导致2个节点都重启,集群2个节点通过VOTE DISK 进行仲裁,驱逐或则有问题的节点自动下线/重启。如果真的脑裂,那么后果会相当糟糕。
    2016-11-25

回答者

myciciy
myciciy21035
IT顾问某金融科技公司
擅长领域: 服务器存储灾备

myciciy 最近回答过的问题

回答状态

  • 发布时间:2016-11-25
  • 关注会员:6 人
  • 回答浏览:2614
  • X社区推广