银行行业企业级监控产品的建设选型、难点及解决方案探讨?

随着互联网金融业务的快速发展,银行业务互联网化,期望突破传统的存贷业务找到新的利润增长点。为此,银行业新建、重构了大量互联网类的业务系统,给系统、网络和应用各条线的运维带来了巨大压力。然而当前银行业运维监控系统的建设仅完成存在性监控的部署,大多数监控数据采用 A...显示全部

随着互联网金融业务的快速发展,银行业务互联网化,期望突破传统的存贷业务找到新的利润增长点。为此,银行业新建、重构了大量互联网类的业务系统,给系统、网络和应用各条线的运维带来了巨大压力。然而当前银行业运维监控系统的建设仅完成存在性监控的部署,大多数监控数据采用 AGENT、SNMP 与系统日志等采样方式获取,数据实时性、精度较低且无法站在全行业务系统的统一管理视角进行监控。即使有的行部署了业务层面的应用监控,选用的监控产品也是五花八门,不同团队又有不同的监控方案。一旦业务系统运行出现问题,交易链路上的网络、系统及业务交易指标相互孤立,缺乏统一的全景展示平台,难以及时找出问题环节。在发生业务故障时,时间往往被耗费在低效的排查工作中,其中的主要问题在于:一旦发生问题,多团队同时开始根据各自经验诊断;缺乏统一视角的证据支持,没有入手点;若无法达成共识,则需要进一步线索进行反复排查。

针对这一问题,之前我行使用的一些监控产品(NPM和BPC)在我行使用效果不太理想,有太多局限了。个人觉得对一些中大银行,还是要有企业级的监控产品和配套的规范,这些规范涉及编码、测试、运维各阶段,且应明确各方人员在监控部署、设计方面的职责分工。

因此,特提出此话题,望各位同行能够给本人答疑解惑,能够告知本人银行业企业级监控产品的建设选型、难点及解决方案,不甚感激!!

收起
参与58

查看其它 9 个回答匿名用户的回答

匿名用户匿名用户

据了解天旦在140家银行客户都用的很好,楼主你用不好,是自身水平问题问,建议你再提高下自己

银行 · 2019-11-14
浏览5358
  • 是吗?我技术水平的确有限,但是天旦的BPC对于网络流量采集设备、自身应用的系统软硬件兼容的确是我见过比较差的。我不知道您是怎么了解到140家银行的使用情况的,如方便,能否提供两家银行的实践案例,我去调研下。
    2019-11-15
  • 你好,我行就在使用天旦的BPC监控,没有遇到流量镜像和硬件不兼容的问题,新实施安装总是需要调试的。BPC的优势是无需应用修改代码,做到日志规范,即可实现对应用交易路径各节点的监控。在定位应用故障节点、哪些交易响应慢、失败率高方面,我觉得是见效快的,特别是运维无法对开发进行要求或者老旧系统不便于改造的。如果各个系统日志都比较规范,例如有每只交易开始、过程、结束、全局流水号的记录,通过日志集中分析平台,也可以实现应用监控。 -如果就旁路应用监控而言,BPC还是可以的,建议找天旦原厂对实施进行总结分析。
    2019-11-15
  • BPC是基于交易报文的吧?不可否认的是BPC的确在应用监控方面突破了传统的基于应用日志的监控思维,不需要安装agent,对应用本身无任何干扰,但是自身应用对于操作系统版本的要求,对于网卡的要求,对一些加密报文解密效率的问题都给使用方带来一些困扰。个人觉得最大的问题是监控功能自由度不够,监控的指标数量、监控展示自定义空间较小,较为依赖厂商。交易的路径还依赖于管理员梳理,无法实现真正的自动发现。
    2019-11-15
  • 我也是天旦BPC的用户,业务级性能监控领域,个人觉得没有更产品化高,易用性强,见效快的产品了,其实天旦BPC还是比较灵活的,只要能力强,自己也能自定义解码,输出各种参数指标的,至于您说的交易路径的梳理,自动发现可能是过于理想化了,实现难度非常依赖报文规范性,这并不是技术难点,而是现状,痛点,只能先应用改造,统一报文格式规范,才能发现得了,否则任何产品都没办法,至多发现上下游关系。另外,监控软件安装在有一定定制的硬件和操作系统上,而不是标准设备上,反而是非常好的做法,因为标准设备的性能有一定的缺陷,经过定制化后能够大幅提高监控性能和用户体验,尤其是减少丢包问题,提高准确性。
    2019-11-15
  • 非常感谢您的回复!您说的业务级性能监控最好的产品是BPC,我觉得要先加个定语,至少要加上旁路监控。我个人认为这款产品的确很有特点,在旁路监控领域是一套成熟的产品。但是您说的统一报文格式我觉得在银行业系统中推行比较有难度,而且您说的对硬件个性化要求是好事我个人不敢苟同,个人觉得一套好的软件产品,兼容性一定要足够好。
    2019-11-26

回答状态

  • 发布时间:2019-11-14
  • 关注会员:13 人
  • 回答浏览:5358
  • X社区推广