这个就涉及到好几个运维系统,集中监控、自动化运维平台,流程平台,CMDB等,每一个都是个独立的项目,而且这些系统都存在千丝万缕的耦合关系。不是一个工具就能实现的,必然是多系统和多系统间融合才能实现的。不过简单的实现统一监控和切换,那就另当别论,一体化运维可不是这么简单。
收起统一监控:
一体化运维一般只是面向本中心,如与其他中心有互联的系统,择一事一议;但只是停留在服务和线路。
系统监控管理分为4层:
1.基础设施层
监控信息:硬件损坏、报警等
包括:IDC管理、空调、电力、服务器、存储、交换机等监控
2.系统层
监控信息:CPU、内存、控件的使用情况;安全防护情况;网络使用情况
包括:操作系统(window、Linux等)、文件系统、安全配置、网络设置等
3.应用层(软件层)
监控信息:服务运行情况。
包括:数据库(Oracle、MySQL等)、WEB服务(apache、MQ等)、中间件(weblogic、Tomcat等)、软件(JAVA等)
注:在这一层监控其他中心,但只监控网络和服务是否正常。(例:OGG数据库同步)
4.业务
监控信息:业务压力、业务运行信息
包括:业务功能模块。
注:结合应用层和系统层进行数据分析,给业务层的监控进行数据支撑。
一键切换:
多中心的切换有两种:
1.应用层切换:
使用软件自己的机制切换;人工切换;
注:单节点切换、单应用切换、多应用切换,主要面对单中心。
2.业务层切换:
使用CDN、负载均衡
注:主要面对多中心
双中心一体化运维:
1、监控&性能容量系统:每个中心各自采集性能信息及告警信息,可以在本中心落地做一次汇聚和过滤,将相关信息送到位于某个中心展现层进行告警或展现。展现层也要在同城做双活部署或主备部署,以备在展现层故障时能够切换到备中心。
2、运维管控平台:双中心对称部署,从某中心的管控平台进入,都要操控本中心和同城中心的任何一个节点。
3、切换:要能支持一键式跨中心切换,包含三个级别:单节点切换、单应用切换、多应用切换(终极场景中整个中心切换),还要能支持回切(主要用于演练)。
能够实现这些功能的运维自动化平台应该很多,也可以自建。