监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。

热点

Kubernetes·2023-03-15
Luga LeeNone 擅长领域:云计算, 容器, 容器云
33 会员关注
Hellofolks!今天我们介绍一下基于Helm快速部署安装PrometheusStack的文章,在本文中,我们将讨论Prometheus和Grafana,以及如何使用Helm图表为任何Kubernetes集群设置监控。我们还将学习如何将Prometheus和Grafana连接在一起,并在Grafana上设置一个基本的仪表板来监控Kubernete...(more)
浏览1845
集中式存储·2023-10-29
heibaiqi某银行 擅长领域:云计算, 容器, 分布式架构
9 会员关注
现如今,全球97%的软件开发者和99%的企业都已使用开源软件,随着开源软件使用的日益广泛,以开源技术运用为核心的新的技术创新体系正在逐渐形成。2021年9月,人民银行联合多部委联合发布《关于规范金融业开源技术应用与发展的意见》(以下简称《意见》),对金融行业如何合规使用开源...(more)
浏览732
Zabbix·2023-05-05
收藏14
评价7
金币1
银行性能监控·2023-08-02
zxd中原银行 擅长领域:服务器, 存储, 信创
35 会员关注
目前的企业级存储对性能监控相关功能都比较完善,不同厂商的存储在性能指标分析方面也具备图表展示能力,可以直观的观察到存储的实时运行情况。一些厂商也提供了一定期限的历史性能分析数据,可以帮助存储管理员来了解和掌握存储的性能情况。但是,想长期分析存储性能的话,可能需...
Zabbix·2023-07-28
myskytreeIT运维管理专家 擅长领域:系统运维, 自动化运维, 一体化运维
3 会员关注
摘要本文主要讲解服务器基础知识,接口协议、以及运维中使用这些协议的场景。侧重讲解Redfish协议产生背景、具体原理,并通过PowerEdge演示如何与Zabbix进行集成,让大家快速的建立多品牌服务器的集中运维监控,提升我们的运维效率。远程管理卡大部分服务器都配有远程管理卡(又叫...(more)
浏览2846
评论2
应用运维·2023-07-25
zhuqibsAdidas 擅长领域:云计算, 服务器, 存储
54 会员关注
前言企业基本都有自己的IT系统,而每个IT系统都有自己的监控系统。企业级的IT应用监控架构是一种综合性的解决方案,涉及到很多层级和相应的工具。随着企业IT系统的规模和复杂程度的不断增加,监控和管理系统也面临着越来越大的挑战。大家有时在建立监控时,不知道从何处入手;有时...(more)
浏览2616
银行监控·2023-07-12
当使用 NAS(Network Attached Storage)时,如果遇到某个客户端或部分客户端访问异常的情况,但存储团队无法直接访问客户端服务器,可以采取以下方法来更好地监控和排查问题:监控 NAS 系统:设置监控系统来实时监测 NAS 系统的运行状态、性能指标和存储容量等。这样可以及时发现异常...
软件开发Zabbix·2023-07-14
waring_id某公司 擅长领域:服务器, 数据库, 存储
8 会员关注
清理历史数据的操作最简单的可以直接在 zabbix 的配置界面中重新设定历史数据的保存和清理期限,另外也可以直接使用数据库指令清理在 zabbix 中历史数据其实包括2个空间占用很大的表: history (历史表)和 trend (趋势表)...
容器·2023-07-05
Luga LeeNone 擅长领域:云计算, 容器, 容器云
33 会员关注
nacos是注册中心,能否以此为接入点,通过nacos监控在nacos注册的各种服务? 这个只是监控“状态” 。如果要以指标为切入点,传统的就用 prometheus 堆栈,流行的就用ebpf可观测框架
软件开发Zabbix·2023-07-07
lych370个人 擅长领域:数据库, 云计算, 容器
17 会员关注
根据报错提示,可以去server的配置文件里去找对应的报错关键字,例如这里我们去grep关键字poller,发现配置文件中跟poller相关的配置项其实并不多,主要是startpollers和startpollersunreachable,另外还有其他几个poller,根据这几项的注释说明,调大相关的参数即可,这里也可以调大所...

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
X社区推广
  • 提问题