贵行的实践对我来讲启发性很大,我这边现在也是小型机 ,虚拟化混合,很多基础实施都是出于开始建设的阶段,也是走的开源的路线,监控用zabbix 日志用ELK ansible 也基本部署好了。由于人力的问题,很多工作需要去做,也想借鉴一下贵行经验。
我们的资源监控用的是摩卡,应用监控用的是天旦,另外一家公司做的整体集成。
运维一期项目主要是做到了资源的统一监控和管理,应用的监控;接着后面主要是进行CMDB、流程建设、自动化运维等;最后往智能化运维发展。
我们目前自动化运维这块建立了三个子系统,批量调度系统、自动化投产系统、自动化运维系统,批量调度主要是日终批量和定时任务调度,自动化投产主要是应用程序和配置投产,自动化运维系统主要是端到端的运维自动化,涉及很多个运维场景,像备份、监控、查询、变更、软件安装配置、安全规范、基线核查、巡检等等,最后在这三个子系统上层,还要搭一层自动化运维与管理平台,统一的界面、统一的自动化管控、统一与外部对接、统一的自动化服务注册和审查等等,自动化这块需要一定的人力去专门做这些事情,要不确实很难,如果选用了开源产品,除了管理这些系统外,还要开发,那就更加耗时耗力。但与此同时,自动化运维的人力增多了,传统运维的人可以适当减少,也可以减轻他们的压力。所以一些银行招聘,都需要招一些即会运维的人,又会开发的人,就是这个原因。
收起我的建议如下: