互联网服务Prometheus

如何干掉Prometheus中维度(Cardinality)过高的指标?

参与3

1同行回答

zhuhaiqiangzhuhaiqiang项目经理银行
根据我们的经验,Prometheus 里有 50% 以上的存储空间和 80% 以上的计算资源(CPU、内存)都是被那么两三个维度超高的指标用掉的。而且这类维度超高的指标由于数据量很大,稍微查得野一点就会 OOM 搞死 Prometheus 实例。首先要明确这类指标是对 Prometheus 的滥用,类似需求完全...显示全部

根据我们的经验,Prometheus 里有 50% 以上的存储空间和 80% 以上的计算资源(CPU、内存)都是被那么两三个维度超高的指标用掉的。而且这类维度超高的指标由于数据量很大,稍微查得野一点就会 OOM 搞死 Prometheus 实例。

首先要明确这类指标是对 Prometheus 的滥用,类似需求完全应该放到日志流或数仓里去算。但是指标的接入方关注的往往是业务上够不够方便,假如足够方便的话什么都可以往 label 里塞。

这就需要我们防患于未然,一个有效的办法是用警报规则找出维度过高的坏指标,然后在 Scrape 配置里 Drop 掉导致维度过高的 label。

收起
银行 · 2019-12-31
浏览2119

提问者

shifo0409
信息分析/架构师日本ITS会社

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-12-31
  • 关注会员:2 人
  • 问题浏览:2889
  • 最近回答:2019-12-31
  • X社区推广