活动简介
先讲一个小案例,某一天用户打电话过来说,业务突然中断了,让我们赶紧过来帮忙处理一下。到了现场用户那里乱成一团,主机,网络,存储,数据库,业务上都在检查各自的问题。经查发现是RAC挂了,DBA通过检查日志发现是脑裂导致的,究其原因网络心跳异常导致的,网络管理员检查网络也没有问题。最后问到近期有没有做过变更,运维管理员说:应集团和上级指示要求风险管理部昨天下发安全风险整改文件,要求我们实施部署了安全加固。昨天晚上在我们的生产环境进行了安全加固。一看里面的内容发现,有一条最为关键,AIX 进行了IP Security 。就是这样这个安全策略才导致RAC心跳通讯中断,发生了脑裂,进而业务不能正常运行。最后赶紧的取消了这个策略,业务正常运行。
除上以外,还有很多类似的例子。如:AIX上执行cfgmgr宕机了;PowerHA双机双存储环境下,主存储故障,业务中断了;使用Mirrorvg数据迁移把数据弄丢了;新上线的系统,半天后,内存用完了,导致业务中断了。这些看似在我们的系统运维的工作很常见的系统故障,或是由系统故障引起的业务中断等情况,其实大家有没有想过,这些可能是因为某一个操作的不妥,或是某一些高危命令应用所引起的。比如说cfgmgr,chfs,unmirrorvg,实施IP Security。这些命令足够简单,足够常见吧!我们甚至以为这些命令我们都用过千百遍了,闭着眼睛都能用好。但事实上,你可能会因为执行这些命令和操作,会把数据丢失了,机器宕机了,业务中断了,造成重大损失。
车大家都会开,但是会开和开好是完全两回事。在本次主题为“AIX上的高危命令产生的"血案"误操作案例交流”在线技术交流中,我们将通过案例的形式,帮助大家解决高危命令应用后可能引发的问题,以及如何分析和诊断问题原因、所出现故障后不同的应对之策。
礼品
活动结束后将有活动嘉宾评选出10个优秀提问者,奖励微信红包一枚或是对量社区金币奖励!
其它说明
本次活动为提问回答形式,不提供相关的课件。您可以在本次活动中分享相关的案例,或是提出相关的问题,或是解答其他会员提出的问题。