监控
监控
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。

文章

业务流程监控·2023-03-13
木讷大叔爱运维 · 互联网+金融 擅长领域:系统运维, 自动化运维, 一体化运维
10 会员关注
背景过去很长一段时间,我们在监控平台的建设之路上不断的探索与实践,同时监控需求也在随着技术架构、业务规模不断的演变:从Nagios、Zabbix到Prometheus;从关系型数据库、非关系型数据库到时序数据库;从服务器硬件、基础运行状态到应用可用性;从服务器、网络、中间件、数据库到...(more)
专栏: 最佳实践
浏览3150
Grafana·2023-03-07
Luga Lee · None 擅长领域:云计算, 容器, 容器云
43 会员关注
Hellofolks,我是Luga,今天我们来分享一下与Grafana有关的观测性话题-GrafanaMimir。作为一个开源软件项目,GrafanaMimir主要为Prometheus提供可扩展的长期存储功能支撑。—01—什么是GrafanaMimir?作为一个开源的、水平可扩展的、高可用的、多租户的开源项目,GrafanaMimir主要...(more)
浏览1279
容器云·2023-02-27
刘肃羽联盟成员 · 银行 擅长领域:云计算, 监控, 容器云
10 会员关注
1研究背景1.1发展现状1.1.1容器云平台我行生产环境使用的永定云平台是一个基于K8S开源软件自研的管理平台,承载了分布式核心、柜面等九十余个容器化应用系统,通过集成SkyWalking、ELK等云原生开源组件,实现了日志、监控等基础运维能力,但是微服务之间的调用关系不能一目了然...(more)
专栏: 最佳实践
浏览4977
评论2
Jaeger·2023-02-21
Luga Lee · None 擅长领域:云计算, 容器, 容器云
43 会员关注
Hellofolks,在之前的文章中,我们介绍了有关Jaeger的数据采样率,在实际的业务场景中,其主要支持以下5种采样率设置,具体如下:1、固定采样(sampler.type=const)sampler.param=1全采样,sampler.param=0不采样。2、按百分比采样(sampler.type=probabilistic)sampler.param=0.1则随机采十...(more)
浏览883
Kubernetes·2023-02-20
Luga Lee · None 擅长领域:云计算, 容器, 容器云
43 会员关注
Hellofolks,我是Luga,今天我们来分享一下如何基于PrometheusStack可视化监控运行在KubernetesCluster上的SpringBoot微服务容器实例。这里,主要针对每一个Java容器实例的指标进行监控,具体涉及:CPU、内存、线程信息、日志信息、HTTP请求以及JVM等。—01—背景概述**随着云原生...(more)
浏览3031
评论1
云原生·2023-02-10
Luga Lee · None 擅长领域:云计算, 容器, 容器云
43 会员关注
Hellofolks,我是Luga,今天我们来聊一下“监控”话题,主要是云原生生态下针对Container的监控,这里,主要探讨的是“技术”层面。自从近十年前Docker和Kubernetes等容器相关技术发展以来,容器改变了大家对资源管控的认知,容器基于共享底层OS内核,将应用程序的执行环境彼此隔离。同...(more)
浏览939
ocp·2023-02-06
在OpenShift中实现网络观测和洞察RedHatOpenShift容器平台(OCP)从一开始就具有监控功能。您可以查看监控仪表板,并管理指标和警报。随着OCP4.10的发布,网络可观察性被引入开发者预览模式。开发者预览提供了对我们红帽公司正在研究的东西的早期访问,但尚未准备好进入生产可用时...(more)
浏览3404
Zabbix·2023-01-11
乐维社区 · 广东乐维软件有限公司 擅长领域:监控, 系统运维, 数据库运维管理
28 会员关注
zabbix监控软件,其可以监控各种网络参数,保证企业服务架构安全运营,同时支持灵活的告警机制,可以使得运维人员快速定位故障、解决问题。zabbix支持分布式功能,支持复杂架构下的监控解决方案,也支持web页面,为主机监控提供了良好直观的展现,今天我们着重来讲讲zabbix如何来监控存...(more)
浏览1960
Zabbix·2023-01-10
乐维社区 · 广东乐维软件有限公司 擅长领域:监控, 系统运维, 数据库运维管理
28 会员关注
说明有时候为了安全,公司的内网环境是不连接外网的,然后又需要针对性的重新编译一个特殊功能的Zabbix监控系统,但是相关的依赖的安装是个比较麻烦的问题,要么制作一个本地yum源进行依赖安装,要么做一个网络映射,让内网机器可以访问外网。如果既不想搭建yum源,又不想做网络映射,那...(more)
浏览640
监控·2022-12-30
山河已无恙 · 浩鲸科技 擅长领域:云计算, 容器, 容器云
6 会员关注
关于ping和mtr的作用使用这里不多介绍,下面提供的实现方式前提是系统通过Systemd来引导进程。ping对于ping来讲可以通过systemd-run来生成临时Service,然后通过journalctl获取命令┌──[root@vms82.liruilongs.github.io]-[~]    └─$systemd-run --unit ping-prin...(more)
浏览3809
评论1

描述

众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般...(more)
众所周知,系统越大,系统也就越复杂;而越是复杂的系统,也就越是容易出现各种各样的问题。系统必须要能时刻知晓系统的当前运行状态,并且在系统出现异常之前或者出现异常的时候,能及时方便地对系统进行检查,对问题进行排查和定位。这些都是由监控功能来实现的。通过监控可以了解系统的运行状态、及时发现异常、分析原因、提早解决,避免系统故障,确保用户对系统的感知度和满意度。一般是通过告警管理、日志管理、信令跟踪、探针、诊断测试来实现对系统的监控。
X社区推广
  • 提问题