自动化运维工具上线后,在减轻运维工作量的同时也带来了潜在风险,尤其是在对系统进行大批量变更时,如安全基线防护、补丁升级等工作,一旦出现问题,往往难以补救。而除了上述风险,自动运维平台自身可能也存在漏洞,很容易被黑客攻击利用,出现灾难性的后果。
大家讨论下,在进行运维自动化建设和使用自动化工具时,都遇到过哪些风险以及如何应对的?
风险就是不知道执行的是否成功,有了校验也不知道校验的是否完全和执行是否成功。一般有了执行脚本就会有校验脚本。所以一下几点值得注意:
1、制定比较通用的校验架构,按脚本规范编写脚本利于脚本的校验;
2、有一些像配置核查的功能也能够帮助我们找出配置的不一致,这些校验功能帮助我们查出风险;
3、自己编写一些脚本各数据的脚本做成定时任务执行,定时的反馈信息;
4、还有就是一些报表,报表也可以校验数据。不同的校验方法针对不同校验级别的数据和功能。
还有限制一些风险的操作,例如:rm,像这些操作就要有审核机制或者其他管理方法。应对风险还有一种就是操作日志,可以通过操作日志进行方向操作能够找回数据。
收起