信创环境下,如何迅速建立完善的立体化监控?

信创环境下的业务尝试,往往以办公OA、邮件系统作为改造和适配的先行代表。这部分业务的故障影响相对来说更为可控。但是这类系统如果发生故障,公司内部感知更为灵敏,这就为监控和预警提出了更高要求。
在信创环境下,既要做好业务监控,也要统筹新环境下的基础监控。
有哪些思路去建立完善的立体化监控,更好地让信创环境融入现有运维生态。

参与12

3同行回答

朱向东朱向东课题专家组高级工程师某银行
建立完善的立体化监控体系需要遵循以下步骤: 1.明确监控目标:在信创环境下,需要明确监控的目标,例如防止数据泄露、防止黑客入侵等。 2.选择监控工具:根据监控目标选择相应的监控工具,例如网络监控工具、数据安全监控工具、物理安全监控工具等。 3.建立监控系统:根据监控目标和...显示全部

建立完善的立体化监控体系需要遵循以下步骤:
1.明确监控目标:在信创环境下,需要明确监控的目标,例如防止数据泄露、防止黑客入侵等。
2.选择监控工具:根据监控目标选择相应的监控工具,例如网络监控工具、数据安全监控工具、物理安全监控工具等。
3.建立监控系统:根据监控目标和选择的监控工具,建立相应的监控系统,包括硬件设备、软件系统、网络连接等。
4.制定监控策略:根据监控目标和监控系统,制定相应的监控策略,包括监控范围、监控频率、监控报警等。
5.培训监控人员:为了确保监控系统的正常运行,需要培训专门的监控人员,提高他们的监控技能和应急处理能力。
6.定期检查和维护:定期检查监控系统的运行情况,及时发现和解决问题,保证监控系统的稳定性和准确性。
总之,建立完善的立体化监控体系需要考虑多个因素,包括监控目标、选择监控工具、建立监控系统、制定监控策略、培训监控人员和定期检查和维护等。只有全面考虑这些因素,才能建立一个安全可靠的监控体系。

收起
银行 · 2023-04-06
浏览658
zzy3620zzy3620课题专家组系统环境管理某城商行
监控需要覆盖各个层面,存储层面例如存储的CPU内存磁盘、ipos、lun的读写响应延时等、数据库的状态、锁、高消耗sql、资源情况、容量情况,操作系统的主要指标,结合业务的探测监控和性能响应类监控,进行综合分析,该监控体系建立有一定难度,需分步逐步建设、关联才能形成一体化监...显示全部

监控需要覆盖各个层面,存储层面例如存储的CPU内存磁盘、ipos、lun的读写响应延时等、数据库的状态、锁、高消耗sql、资源情况、容量情况,操作系统的主要指标,结合业务的探测监控和性能响应类监控,进行综合分析,该监控体系建立有一定难度,需分步逐步建设、关联才能形成一体化监控能力。

收起
银行 · 2023-02-06
浏览959
谐云科技谐云科技研发工程师杭州谐云科技有限公司
关于立体化监控,可以围绕指标监控、链路追踪、日志分析为支柱构建全面的可观测能力。通过采集这三个维度的有效数据,包括CPU、内存、磁盘、网络、中间件、应用等在内的各类指标数据采集与汇聚;构建完整的全链路请求拓扑,并且这个请求拓扑还需要是动态识别更新的;基于ELK等成熟...显示全部

关于立体化监控,可以围绕指标监控、链路追踪、日志分析为支柱构建全面的可观测能力。通过采集这三个维度的有效数据,包括CPU、内存、磁盘、网络、中间件、应用等在内的各类指标数据采集与汇聚;构建完整的全链路请求拓扑,并且这个请求拓扑还需要是动态识别更新的;基于ELK等成熟方案完成日志数据采集分析。并在此基础上,进一步打通这三个维度的关联关系,构建全面可观测的监控体系,可以实时掌握业务的运行状态,及时发现业务故障,发出告警预警,并能层层下钻分析,快速定位故障源头。这是目前业界比较推荐且应用广泛的实现方案。

除了信创环境,现在企业信息化系统的基础设施环境会更复杂,还包括各类云原生云平台、虚机集群、物理机,往往还会是多种环境并存,系统业务所采用的开发语言和技术架构也会不同,这就要求我们去构建可观测能力的时候首要考虑的是如何建立统一的监控采集分析体系,这种采集分析的实现方式要能兼容信创和非信创环境,兼容各种基础设施,最好不需要业务系统进行改造,不侵入应用,就能完成监控数据的采集与分析。

兼顾上述两方面考虑,eBPF技术可以起到很大的作用。eBPF技术是Linux内核3.15版本中引入的全新设计,自从2014年发布以来,一直都备受瞩目。基于eBPF技术可以在用户空间和内核空间之间架起“桥梁”,不依赖于应用技术栈,不局限于信创或非信创环境,完成各类监控数据的采集分析和汇聚,可以构建统一的监控运维体系。

收起
软件开发 · 2023-02-15
浏览1656

ChatGPT 回答

在信创环境下建立完善的立体化监控,可以从以下几个方面入手:

  1. 建立全面监控体系:针对办公OA、邮件系统等业务,建立全面的监控体系,包括系统性能、网络质量、安全性等方面的监控。同时,也要建立基础设施监控体系,包括服务器、存储、网络等基础设施的监控,以确保业务系统的稳定运行。
  2. 引入自动化监控:通过引入自动化监控技术,可以实现对业务系统和基础设施的实时监控和预警。例如,可以使用自动化监控工具来检测系统性能、网络质量等指标,一旦出现异常就能及时发出警报,帮助运维人员快速定位问题并解决。
  3. 建立预警机制:在监控体系中,建立预警机制是非常重要的。通过设置预警阈值,当系统性能或网络质量等指标超过预设阈值时,自动发出警报,提醒运维人员及时处理。同时,还可以建立预警处理流程,确保问题能够及时得到解决。
  4. 数据分析和挖掘:通过对监控数据进行分析和挖掘,可以发现潜在的问题和瓶颈,帮助运维人员优化系统性能和提高运行效率。例如,可以通过数据分析找出系统的瓶颈,进而对系统进行优化。
  5. 建立监控报告和分析平台:建立监控报告和分析平台,可以帮助运维人员更好地了解系统的运行情况和趋势,及时发现问题并采取措施。同时,还可以通过监控报告和分析平台,对系统的运行情况进行分析和评估,为系统的优化和升级提供参考。

综上所述,建立完善的立体化监控体系,需要从全面监控、自动化监控、预警机制、数据分析和挖掘、监控报告和分析平台等方面入手,以确保业务系统和基础设施的稳定运行。

提问者

wakeme
系统运维中国银联
擅长领域: 信创云计算信创云

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-02-03
  • 关注会员:4 人
  • 问题浏览:2881
  • 最近回答:2023-04-06
  • X社区推广