关于云商租户监控定制化监控问题?

请教各位是如何实现对云上租户的监控个性化?对于云上业务容器监控的场景,我们环境是使用普罗作为监控平台。目前使用普罗监控是对于整个集群的,就是统一设置指标,例如集群内namespace当超过50%就出现告警。这样当租户有需要设置维护期,或者需要对自己的业务POD做定制化告警时,...显示全部

请教各位是如何实现对云上租户的监控个性化?
对于云上业务容器监控的场景,我们环境是使用普罗作为监控平台。目前使用普罗监控是对于整个集群的,就是统一设置指标,例如集群内namespace当超过50%就出现告警。这样当租户有需要设置维护期,或者需要对自己的业务POD做定制化告警时,就无法满足了,请教这种场景各位是如何满足的?

收起
参与4
  • 我们采用了如下方案希望能给到一些帮助 1. 普罗米修斯仅作为监控,利用后端的时序数据库做数据存储。 2. 不使用altermanager作为告警系统,采用夜莺作为告警系统,可以方便的进行告警策略的调整,以及单独pod的设置。还有个好处是可以直接管理多个集群的告警。
    2022-07-24

返回罗文江的回答

罗文江罗文江课题专家组云计算架构师某银行

1、将容器平台的监控告警、应用的监控告警进行解耦。  容器平台的监控告警,是为平台的稳定运行服务的,不承接各个租户的业务监控告警。
2、应用的监控,建议事先做好规范,要求应用开发遵循规范和数据埋点。采集的数据统一收集后,进行监控和告警。

银行 · 2022-06-26
浏览750

回答者

罗文江
云计算架构师某银行
擅长领域: 云计算容器容器云

罗文江 最近回答过的问题

回答状态

  • 发布时间:2022-06-26
  • 关注会员:2 人
  • 回答浏览:750
  • X社区推广