系统监控
系统监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题,系统监控的目的是通过预设参数及实施图表及时发现系统中的故障,减少故障处理时间。
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题,系统监控的目的是通过预设参数及实施图表及时发现系统中的故障,减少故障处理时间。

问题

IT其它Zabbix·2021-04-28
zhangfan13 · 某单位 擅长领域:监控, 系统运维, 数据库运维管理
10 会员关注
这个问题其实应该由IIS管理员来回答,监控的方式很多,可以检查IIS服务状态、日志等信息都可以的,但需要 IIS管理员 告诉我们具体的监控逻辑
IT其它自动化运维·2021-04-19
宁泽阳 · 某科技公司 擅长领域:存储, 服务器, 分布式系统
10 会员关注
故障自愈能力首先依赖于整体架构的高可用性,架构高可用时已具备基本的故障自愈能力。同时在运维过程中可以逐步梳理故障对应的监控告警以及标准化的处理流程,并将这些处理流程自动化后配置在类似zabbix这种监控工具或者其他自动化运维平台上来进行故障告警的自动化处理,从而...
银行Zabbix·2021-04-01
沈天真 · IPS 擅长领域:服务器, 云计算, 存储
13 会员关注
建议先检查一下监控系统和被监控系统的系统时间吧;
系统集成Kubernetes·2020-12-29
lzj7618937 · cib 擅长领域:云计算, 容器, 容器云
6 会员关注
多集群监控可以参考下:https://cloud.tencent.com/developer/article/1402436对于一个数据中心整体挂了的话,就顶层网关切换流量。但必须保证底层数据同步的有效性。个别应用还是得看是否数据完整。...
银行Zabbix·2020-07-28
myskytree · IT运维管理专家 擅长领域:系统运维, 自动化运维, 监控
3 会员关注
通常此类监控项需要在OS安装采集引擎。采集引擎可以获取到当前系统的时间,能够精确到毫秒。但是从监控系统的原理来说,监控系统是一个采样系统,没必要采集的时间轮询间隔频繁到到毫秒【浪费业务机器的系统资源】。通常1分钟,5分钟就可以。部分HA的场合也只需要做到30秒检查一...
能源采矿系统监控·2020-06-17
zhangpeng4007 · 某城市商业银行 擅长领域:存储, 灾备, 服务器
18 会员关注
整体的硬件监控系统是有厂商开发的,不过对异构存储支持的并不理想,而针对异构存储监控的软件是商用的软件SC。1.是否只要被监控的设备管理口能通讯就能纳入这个监控系统? 根据监控软件不同,和所管理设备不同,结果也不同,但管理口基本都需要接,部分还需要监控前置机或设备管理机...
能源采矿系统运维·2020-05-22
贺勇 · Canway 擅长领域:云计算, 系统运维, 服务器
19 会员关注
建议了解一下谷歌的SRE理论以及混沌工程,一个业务系统的可靠性保障,绝对不是一个非常牛B的监控系统就能解决的。1. 和应用系统本身的架构有紧密的关系;2. 和团队组织架构,人员能力,流程制度,应急预案都有紧密关系;3.就监控系统本身而言,有一句话讲的比较好“管理事件要在事件管...
银行系统监控·2020-01-03
贺勇 · Canway 擅长领域:云计算, 系统运维, 服务器
19 会员关注
应对告警风暴业界已经有比较成熟的方案,参考架构如下:

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题,系统监控的目的是通过预设参数及实施图表及时发现系统中的故障,减少故障处理时间。
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题,系统监控的目的是通过预设参数及实施图表及时发现系统中的故障,减少故障处理时间。
X社区推广
  • 提问题