监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。

文章

容器·2021-05-26
dmsong · IPS 擅长领域:服务器, AIX, Unix
9 会员关注
最近,我们的某个用户在Open Power服务器FP5280G2上运行alpine镜像容器,在alpine容器里编译ELK的时候,报错segmentfault(coredumped)。切换了Alpine版本3.11.6和3.13.5,openjdk8和openjkd11,logstash7.6.1和6.6.2,都是同样的现象。现象为,在执行到/usr/share/logstash/bin/logst...(more)
浏览5401
Prometheus·2021-05-24
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
Prometheus介绍Prometheus是一套开源的系统监控报警框架。它启发于Google的borgmon监控系统,由工作在SoundCloud的google前员工在2012年创建,作为社区开源项目进行开发,并于2015年正式发布。2016年,Prometheus正式加入CloudNativeComputingFoundation,成为受欢迎度仅次于Kuber...(more)
浏览2236
Prometheus·2021-05-21
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
Prometheus是新一代的监控系统解决方案,原生支持云环境,和kubernetes无缝对接,的却是容器化监控解决方案的不二之选。当然对传统的监控方案也能够兼容,通过自定义或是用开源社区提供的各种exporter无疑又为prometheus丰满羽翼。那么从今天开始我将会持续更新我对prometheus使...(more)
浏览2058
Zabbix·2021-05-19
chinesezzqiang课题专家组 · M 擅长领域:云计算, 存储, 私有云
430 会员关注
ThefrontenddoesnotmatchZabbixdatabase.Currentdatabaseversion(mandatory/optional):4020000/4020000.Requiredmandatoryversion:4000000.Contactyoursystemadministrator.问题原因:当前数据库版本与所需数据库版本不一致;解决方法:登录数据库,修改数据库版本的mandatory值...(more)
浏览1419
Prometheus·2021-05-18
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
容器使监视复杂化过去,有限的静态物理服务器和虚拟机,以及数量有限的指标使得监控很简单直接。今天,由于容器的使用以及组织向微服务架构的迁移,要跟踪的实体数量激增,使得监控越来越复杂。现在,云环境中有很多容器,有时每台机器上有数百个容器,同时当与Kubernetes一起使用时,它们...(more)
浏览2978
Kubernetes·2021-05-17
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
Prometheus是一款面向云原生应用程序的开源监控工具,本文介绍如何基于阿里云容器Kubernetes版本部署Prometheus监控方案。前提条件* 您已经成功创建一个Kubernetes集群,参见创建Kubernetes托管版集群。* 您已连接到集群,方便快速查看节点标签等信息,参见通过kubectl连接Kub...(more)
浏览2466
Zabbix·2021-05-13
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
这篇文章主要介绍了基于zabbix实现监控Jenkins过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下一、监控架构图二、实现思路* 在Jenkins上安装Metrics插件,使Jenkins暴露metricsapi;* 编写python代码从api抓取...(more)
浏览2341
Zabbix·2021-05-13
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
这篇文章主要介绍了分布式监控系统之Zabbix主动、被动及web监控的过程详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下前文我们了解了zabbix的网络发现功能,以及结合action实现自动发现主机并将主机添加到zabbixhosts中,链接...(more)
浏览1939
Zabbix·2021-05-13
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
本文给大家介绍如何监控windows平台下的ogg程序。(注:所有操作都在administrator用户下面进行操作)1.修改agent配置文件zabbix_agentd.win.conf我的agent配置文件在C:\zabbix_agents_3.4.6.win\conf目录下,根据自己安装zabbixagent的目录,每人都可能不一样在文件的末尾添加...(more)
浏览707
Zabbix·2021-05-13
gy13100892256 · 电信 擅长领域:系统运维, 自动化运维, 云计算
5 会员关注
这篇文章主要介绍了利用zabbix监控ogg进程(Linux平台)的方法,帮助大家更好的理解和使用zabbix,感兴趣的朋友可以了解下前段时间生产的一个数据库的ogg进程挂了快半个月才被发现,已经起不来了,只有重新初始化再同步。因此很有必要监控下ogg的进程,这里给大家介绍如何使用zabbix...(more)
浏览2171

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
X社区推广
  • 提问题