自动化运维在架构设计上是一个关键问题,既要考虑各个企业在实际运维中的需要,也要结合未来发展的扩展规划。最重要的是如何将“监”、“管”、“控”有效的结合在一起。
自动化运维平台的设计十分重要,很多操作都封装成流程执行,对外暴露的信息较少,所以需要对操作进行记录,主要包括以下几个方面:
1.记录用户操作日志,做到有据可查,满足“监”的要求。
2.合理设计审批流程,对于重要流程和命令操作进行审核,满足“管”的要求。
3.做好系统权限的设计,不同岗位角色具有不同权限,各司其职,满足“控”的要求。
监、管、控,一定要紧密的联系在一起,首先要建立好一个有效的管理制度或者机制,明确责任单位和责任人,对各种情况做好预案,严格执行。
架构的范围太大了,在设计之初可能会有所不足,一定要考虑预留网络入口(物理)可以不接,但要有,操作权限要有分级,后台记录要完备,包括安全的鼠标或键盘记录,定期的系统日志、安全记录导出及清除。
自动化系统是孤网存在的,要做好定期控制器、交换机、服务器的排查,定期对硬盘做好备份工作,为日后可能成为IDC做准备,这是日后的方向。
公司全范围的vlan一定要有规划做好地址池的划分,出现问题一定不能影响全局,并做好备份机制。
各种程序的改写一定好做好记录,主要是时间、修改人员、目的及过程。
说实话我没太理解这里的监管控是具体指什么,我就说下我的理解。我理解的监是监控,是对告警事件的发现和通知机制。管是管理,就是告警事件发生后如何进行管理应对,处理告警事件。控我的理解是控制,就是对于处理过的告警事件如何进行有效的管控,避免此类问题再发生。那么这就需要一个流程依托于一个平台来进行实现。关联起来就是一个告警事件的全生命周期。
收起