监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。

热点

Prometheus·2021-12-22
airstuky · 某金融银行 擅长领域:数据库, 云计算, 服务器
10 会员关注
收藏6
评价6
金币1
系统运维·2021-11-24
powertiandi联盟成员 · 李宁(中国)体育用品有限公司 擅长领域:存储, 服务器, 灾备
804 会员关注
自从有疫情以来,时间好像加装了翅膀,每天在不知不觉中飞快度过。总感觉有点小忙,有时还忙的不知所以然。好久没有坐下来写运维方面的东西了,近期收到好友邀请准备计划写一点有关监控类Zabbix的方面小文。做运维算算也有不少年头了,接触过的监控产品也算是不少了,产品也是多种多...(more)
浏览9601
评论4
系统融合·2021-11-18
Steven课题专家组 · steven 擅长领域:云计算, 容器, 容器云
75 会员关注
最近听了李老师的《业务流程重构(BusinessProcessReengineering)》,感觉和我一直以来的一些体会和思路不谋而合。道理都是相通的,殊途同归。李老师强调fundamentalrethinking(彻底的重新思考)、radicalredesign(根本的重新设计)、dramaticimprovement(显著的提升)。系统融合思...(more)
浏览5104
Zabbix·2021-11-17
jiaoyutwt · 山西省运城市盐湖区 擅长领域:系统运维, 监控, 数据库监控
33 会员关注
基于zabbix+gafana实现数据中心可视化展示,大运汽车数据中心运维监控系统建设实践1.背景介绍在数据中心建设方面,自2019年起大运汽车逐步向自动化运维方向发展,当然必不可少的要面临企业级监控软件的选择,凭借着多年对自动化运维理解,最终基于Zabbix+Grafana部署实践了数据中...(more)
浏览8320
评论8
Zabbix·2021-11-03
匿名用户
收藏4
金币1
Prometheus·2021-11-05
airstuky · 某金融银行 擅长领域:数据库, 云计算, 服务器
10 会员关注
收藏3
金币1
Prometheus·2021-11-05
airstuky · 某金融银行 擅长领域:数据库, 云计算, 服务器
10 会员关注
收藏4
评价3
金币2
Prometheus·2021-11-05
airstuky · 某金融银行 擅长领域:数据库, 云计算, 服务器
10 会员关注
收藏3
评价5
金币1
银行监控·2021-10-28
北京不眠夜@博云 · 公司 擅长领域:云计算, 容器, 容器云
3 会员关注
现在常见的做法都是加入数据分析,形成AIOps方案,实现智能分析,进而压缩无效告警,提升告警质量。目前,AIOps方案和厂家有很多,但总体效果差强人意,但方向是没问题的,还需要时间积累。告警规则的优化,是经常被忽略的地方。通过,细化告警触发规则,不同业务不同资源提供更加匹配的告警规...
互联网服务监控·2021-09-08
hufeng719联盟成员 · 某钢铁企业 擅长领域:数据库, 存储, 服务器
145 会员关注
楼主能否共享下您的 prometheus 安装部署文档?跪求 我们也计划部署监控系统  但是自己不会搞

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
X社区推广
  • 提问题