监控系统最大的痛点就是故障快速定位,目前很多银行都有网络监控、存储监控、系统监控、数据库监控、中间件监控、交易性能监控。
但是这些专业级的监控基本是孤立的,没有整合再一起,所以当网络、数据库或者中间件发生故障时并不知道这些基础层面的故障会影响哪些业务系统;
或者业务系统不能正常进行交易时不能准确定位到底是网络问题还是数据库问题、中间件问题。
建议建设一套一体化监控管理系统,将各专业监控的性能数据、告警数据整合在一起,进行统一的管理和实时的关联分析,能够快速有效地定位故障的告警根源
,提高故障诊断的效率,从而构建不同层级,不同部门间协调解决问题的平台,成为应对突发事件、支持领导决策的一种重要手段。
要想建设好这套系统,首先建议采用垂直分层的建模思路设计端到端业务资源模型,按照业务资源对象在业务实现中
的角色不同,把资源分为直接的业务服务、承载系统、组件三个层次,承载系统在端到端流程中是提供直接服务的依托环境,而组件
是以一种透明的方式展示业务完整性所经过的处理环节,承载系统和组件为业务系统提供直接的功能支撑。
另外建议增加可视化监控,给运维人员提供不同视图从业务角度快速定位问题,同时也能从网络、数据库层面知晓受影响的业务系统。