银行行业企业级监控产品的建设选型、难点及解决方案探讨?

随着互联网金融业务的快速发展,银行业务互联网化,期望突破传统的存贷业务找到新的利润增长点。为此,银行业新建、重构了大量互联网类的业务系统,给系统、网络和应用各条线的运维带来了巨大压力。然而当前银行业运维监控系统的建设仅完成存在性监控的部署,大多数监控数据采用 A...显示全部

随着互联网金融业务的快速发展,银行业务互联网化,期望突破传统的存贷业务找到新的利润增长点。为此,银行业新建、重构了大量互联网类的业务系统,给系统、网络和应用各条线的运维带来了巨大压力。然而当前银行业运维监控系统的建设仅完成存在性监控的部署,大多数监控数据采用 AGENT、SNMP 与系统日志等采样方式获取,数据实时性、精度较低且无法站在全行业务系统的统一管理视角进行监控。即使有的行部署了业务层面的应用监控,选用的监控产品也是五花八门,不同团队又有不同的监控方案。一旦业务系统运行出现问题,交易链路上的网络、系统及业务交易指标相互孤立,缺乏统一的全景展示平台,难以及时找出问题环节。在发生业务故障时,时间往往被耗费在低效的排查工作中,其中的主要问题在于:一旦发生问题,多团队同时开始根据各自经验诊断;缺乏统一视角的证据支持,没有入手点;若无法达成共识,则需要进一步线索进行反复排查。

针对这一问题,之前我行使用的一些监控产品(NPM和BPC)在我行使用效果不太理想,有太多局限了。个人觉得对一些中大银行,还是要有企业级的监控产品和配套的规范,这些规范涉及编码、测试、运维各阶段,且应明确各方人员在监控部署、设计方面的职责分工。

因此,特提出此话题,望各位同行能够给本人答疑解惑,能够告知本人银行业企业级监控产品的建设选型、难点及解决方案,不甚感激!!

收起
参与58

查看其它 9 个回答jason2006xu的回答

jason2006xujason2006xu  技术经理 , 昆仑银行

监控系统最大的痛点就是故障快速定位,目前很多银行都有网络监控、存储监控、系统监控、数据库监控、中间件监控、交易性能监控。

但是这些专业级的监控基本是孤立的,没有整合再一起,所以当网络、数据库或者中间件发生故障时并不知道这些基础层面的故障会影响哪些业务系统;

或者业务系统不能正常进行交易时不能准确定位到底是网络问题还是数据库问题、中间件问题。

建议建设一套一体化监控管理系统,将各专业监控的性能数据、告警数据整合在一起,进行统一的管理和实时的关联分析,能够快速有效地定位故障的告警根源

,提高故障诊断的效率,从而构建不同层级,不同部门间协调解决问题的平台,成为应对突发事件、支持领导决策的一种重要手段。

要想建设好这套系统,首先建议采用垂直分层的建模思路设计端到端业务资源模型,按照业务资源对象在业务实现中

的角色不同,把资源分为直接的业务服务、承载系统、组件三个层次,承载系统在端到端流程中是提供直接服务的依托环境,而组件

是以一种透明的方式展示业务完整性所经过的处理环节,承载系统和组件为业务系统提供直接的功能支撑。

另外建议增加可视化监控,给运维人员提供不同视图从业务角度快速定位问题,同时也能从网络、数据库层面知晓受影响的业务系统。

银行 · 2019-11-14

回答者

jason2006xu
技术经理昆仑银行
擅长领域: 系统运维监控云计算

jason2006xu 最近回答过的问题

回答状态

  • 发布时间:2019-11-14
  • 关注会员:13 人
  • 回答浏览:5513
  • X社区推广