监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
热点
来自主题:监控 · 2021-03-30
penghuasheng广发证券 擅长领域:监控, 大数据, 大数据分析
17 会员关注
近年来,随着计算机技术的飞速发展,以及行业信息的共享,传统企业的运维己不再是固步自封,日新月异的计算技术的发展推动企业云平台的建设,云平台的计算能力为大数据分析提供了基础、云平台与大数据分析又将推动运维人工智能的发展。放眼云、大数据、人工智能的运维发展方向的...(more)
浏览2359
评论2
来自主题:容器 · 2020-06-19
youki2008DDT 擅长领域:Linux, Zabbix, 数据库
97 会员关注
对于容器和k8s资源监控,promethus是再合适不过了
浏览1751
回答4
来自主题:系统运维 · 2021-03-11
penghuasheng广发证券 擅长领域:监控, 大数据, 大数据分析
17 会员关注
客观的讲,通过总结一些工作心得,让自己的运维知识体系的建设有些效果。年初与一个行业大牛的朋友交流时,在听到他年轻时在思科的一些关于将工作方法升华为方法论,比如“监、管、控”、“新网点”理念,并推动整个行业建设时为之一震。这个触动让我有了让自己的运维知识体系建设...(more)
浏览1431
来自主题:运维 · 2021-03-15
前些天一个银行客户的核心系统因为服务器连接存储IO卡发生故障,存储多路径驱动未能及时将LUN故障链路PATH置为Failled,从IO卡故障后尝试开始进行自我恢复到恢复失败有5分多钟,部分IO请求也pending了5分多钟,才返回失败,然后才转由正常Path重发处理。核心系统上数据库却不能响...(more)
浏览1108
来自主题:容器云平台 · 2021-01-14
容器云大赛2020容器云职业技能大赛组委会 擅长领域:容器云, Kubernetes, OpenShift
149 会员关注
收藏2
评价3
金币1
来自主题:容器云 · 2020-12-07
priestNone 擅长领域:Redis, MongoDB, MySQL
13 会员关注
基本上各个层级都可以监控到的
浏览627
回答2
来自主题:监控 · 2020-10-15
HsukkHRBB 擅长领域:监控, 性能监控
4 会员关注
背景概述监控是IT运维体系中的重要组成部分,作为运维和安全生产保障的生命线必不可少。运维的安全生产保障,主要以“监、管、控、防”为核心,其中“监”则主要指监控。随着科技革命的进行,大数据、微服务、云计算等新技术和架构的应用应运而生,传统的技术框架满足不了日益变化...(more)
浏览1946
评论1
来自主题:Ceph · 2020-08-21
zhuqibsMcd 擅长领域:Oracle, Ceph, OpenStack
34 会员关注
all-in-kubenetes,我们公司就用Prometheus+grafana把监控全包了,监控需要统一,工具太多,未必是好事。
浏览1457
回答3
来自主题:监控 · 2020-07-11
youki2008DDT 擅长领域:Linux, Zabbix, 数据库
97 会员关注
总的来说,巡检是对监控的一种补充。巡检是人工进行的例行检查,对机房数据中心的环境和设备进行检查登记,及时发现故障和隐患。监控系统是通过网络协议采取相关设备(例如服务器,存储,交换机,路由器,备份设备等)和系统(例如windows,Linux,Web,db,负载均衡等)的数据,根据设定的规则来判断...
浏览2386
回答6
来自主题:监控 · 2020-06-17
mtming333某电子支付 擅长领域:容器, Kubernetes, 容器云
6 会员关注
拉取全量标签,按需过滤、替换、丢弃后再利用
浏览2734
回答2
描述
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
相关企业云社区
  • 日志易

    主题声望 91

  • 提问题