互联网服务监控 Prometheus

prometheus设置告警策略，如何进行分类管理？

我们使用prometheus来实现基础设施层的监控。在对监控对象设置告警策略时，例如CPU平均负载，将所有监控对象的CPU阈值设置为大于CPU核心数量时触发告警。这样就面临一个问题，计算密集型的业务会时时刻刻告警。后来，我们尝试将CPU负载告警策略，分为三种类型(灵敏型，标准型，迟钝型)用不同的阈值来表示，粗略的将应用分为三类以适应不同的应用类型，这种方式也只能将告警策略分为三类，如果我们的应用对CPU的使用有几十种类型呢？要对CPU这一个指标设置十几个告警策略吗？如果每个监控指标都这样划分，那么怎么来管理呢？在zabbix和open-falcon中告警策略有父子关系，可以针对某个应用设置单独策略，自动解决继承关系，但prometheus的rule似乎没这种能力。
各位是怎么解决的呢？

参与5

1同行回答
全部行业
全部行业 能源采矿
|
按赞同排序
按时间排序

联盟成员

系统工程师某钢铁企业

楼主能否共享下您的 prometheus 安装部署文档？跪求我们也计划部署监控系统但是自己不会搞

能源采矿 · 2021-09-09

浏览1350

twt社区管理员，路人丁邀答

bjc96333
Prometheus完整的部署方案+实战实例https://www.talkwithtrend.com/Document/detail/tid/443117
2021-09-09
赞同
评论

添加评论

提问者

SREAAAA

擅长领域：监控，系统运维，一体化监控

评论7

相关问题

如何监控和分析HPC平台的资源利用状况,评估工作负载与硬件之间的匹配情况?

在现有监控系统下，如何进行容器云应用监控实施？

400台云主机+ 100台k8s的node，用什么方案监控好呢？ zabbix？prometheus？还是两套都上？

prometheus grafana 容器微服务监控？

grafana图，有时能显示全，有时只能显示部分时间段的数据？

相关资料

监控指标清单(操作系统、私有云、达梦数据库、mysql、nginx、tomcat）

Prometheus监控实战 (云计算与虚拟化技术丛书) - 詹姆斯·特恩布尔（James Turnbull）

Prometheus 非官方中文手册

《迈向YB数据时代》2022夏季刊之——【持续运维】议题1：云平台存储如何实施全方位监控？

Dell容器环境持久化存储自动化解决方案-弹性，容灾，备份，迁移，监控，权限管理等

相关文章

某银行基于容器云的应用服务架构实践

企业可视化业务流程监控对运维人员的重要性

一文搞懂基于 Helm 部署 Prometheus Stack 全家桶

云原生全栈监控

关于Linux下通过ping/mtr 长期监控网络输出日志报告的一些笔记

问题状态

发布时间：2021-09-08

关注会员：3 人

问题浏览：2081

最近回答：2021-09-09

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广