400台云主机+ 100台k8s的node,用什么方案监控好呢? zabbix?prometheus? 还是两套都上?

参与28

10同行回答

pysx0503pysx0503系统工程师第十区。散人
对容器了解的不多。不过按现在主流的方式来说。好像prometheus对容器的监控更好一些。按我的理解我应该会用zabbix监控网络和主机性能, prometheus来主要针对容器监控。形成一个互补的监控方案...显示全部

对容器了解的不多。不过按现在主流的方式来说。好像prometheus对容器的监控更好一些。
按我的理解我应该会用zabbix监控网络和主机性能, prometheus来主要针对容器监控。形成一个互补的监控方案

收起
系统集成 · 2022-06-07
jason2006xujason2006xu技术经理昆仑银行
个人建议直接上Prometheus,理由如下:1、Prometheus可以监控主机(cpu、内存、磁盘空间等)、网络。2、prometheus是K8s的孪生兄弟,可以监控docker、pod,还有master,比zabbix有天然优势。3、400台云主机+100个node纳管数量对于Prometheus不是问题。4、prometheus可以定制开发export...显示全部

个人建议直接上Prometheus,理由如下:
1、Prometheus可以监控主机(cpu、内存、磁盘空间等)、网络。
2、prometheus是K8s的孪生兄弟,可以监控docker、pod,还有master,比zabbix有天然优势。
3、400台云主机+100个node纳管数量对于Prometheus不是问题。
4、prometheus可以定制开发exporter轻松实现采集代理定制开发。

收起
银行 · 2022-06-07
浏览1346
zhangfan13zhangfan13项目经理某单位
容器云平台的监控首选prometheus从监控指标这个角度,因为prometheus天然就和k8s监控做了集成,监控指标几乎是开箱即用(这点是最重要的,不管k8s如何升级迭代,我们都不用花精力去适配开发监控指标,因为 k8s 已经提供了基于 prometheus 的专业监控能力),一些特殊的监控需求也可以定...显示全部

容器云平台的监控首选prometheus
从监控指标这个角度,因为prometheus天然就和k8s监控做了集成,监控指标几乎是开箱即用(这点是最重要的,不管k8s如何升级迭代,我们都不用花精力去适配开发监控指标,因为 k8s 已经提供了基于 prometheus 的专业监控能力),一些特殊的监控需求也可以定制开发exporter来实现。
从性能容量这个角度看,400台云主机+ 100台k8s的node只能算是比较小规模的环境了,一套 prometheus server 完全够用,如果后续规模扩大,可以通过 prometheus server 集群的方式来扩大性能容量,支撑能力完全没问题。
从以上两个角度看,只用 prometheus就够了,除非你的项目之前主要使用的是zabbix,你不想彻底用 prometheus替换zabbix(毕竟要花巨大的人力物力),那就可以考虑用 prometheus 做容器云平台的监控采集,把数据集成到zabbix里去,这样两套工具就结合起来了。

收起
银行 · 2022-06-08
浏览1333
chinesezzqiangchinesezzqiang课题专家组信息技术经理M
zabbix虽然是一个开源产品,但是其本身对容器的监控说实话没有prometheus好,比较适合主机、网络、存储等常规的环境监控。显示全部

zabbix虽然是一个开源产品,但是其本身对容器的监控说实话没有prometheus好,比较适合主机、网络、存储等常规的环境监控。

收起
IT其它 · 2022-06-08
浏览1324
powertiandipowertiandi联盟成员系统架构师李宁(中国)体育用品有限公司
因为不涉及硬件的监控 ,OS+容器 prometheus 作为趋势和整体方案更为合理些。目前zabbix监控k8s成熟度还有待提高。显示全部

因为不涉及硬件的监控 ,OS+容器 prometheus 作为趋势和整体方案更为合理些。目前zabbix监控k8s成熟度还有待提高。

收起
互联网服务 · 2022-06-08
浏览1372
天衣无缝天衣无缝工程师杭州市中医院
上只能建议上一套,两个同时上性能开销太大,资源利用率随之下降,两者选其一即可,prometheus呢直接原生的方案可以直接搞定大批量的资源监控并发,zabbix呢可能因为并发的限制要稍微设计下架构...显示全部

上只能建议上一套,两个同时上性能开销太大,资源利用率随之下降,两者选其一即可,prometheus呢直接原生的方案可以直接搞定大批量的资源监控并发,zabbix呢可能因为并发的限制要稍微设计下架构

收起
事业单位 · 2022-06-07
浏览1368
hufeng719hufeng719联盟成员系统工程师某钢铁企业
各位老师回答的都很好。没什么好补充的了。看作者主要关心什么指标。正如大家所说zabbix偏物理主机、网络、磁盘、资源、进程、服务等综合性较好。prometheus主要偏向于容器、pod监控。各有各的优点。个人感觉zabbix简单一些,prometheus+grafana+alertmanager一直是我的梦...显示全部

各位老师回答的都很好。没什么好补充的了。看作者主要关心什么指标。正如大家所说zabbix偏物理主机、网络、磁盘、资源、进程、服务等综合性较好。prometheus主要偏向于容器、pod监控。各有各的优点。个人感觉zabbix简单一些,prometheus+grafana+alertmanager一直是我的梦想,至今都没完整的搭建出来。尤其是 alertmanager 配置个性化设置较为复杂。具体效果还不太了解。上面jiaoyutwt的老师说zabbix也支持监控k8s ,不知道监控到什么粒度?有没有模板?能否与大家一起分享下?

收起
能源采矿 · 2022-06-07
浏览1442
jiaoyutwtjiaoyutwt系统运维工程师山西省运城市盐湖区
400台云主机+ 100台k8s的node没有说要监控容器,监控的是节点与主机。  zabbix和prometheus 都可以。推荐zabbix,如果要监控容器,当然用 prometheus ,不过现在zabbix也支持监控k8s,要看模板的支持度能否满足自己的监控需要。 自己是做IT基础设施的,当然比较偏向zabbix,对硬件...显示全部

400台云主机+ 100台k8s的node

没有说要监控容器,监控的是节点与主机。  zabbix和prometheus 都可以。
推荐zabbix,如果要监控容器,当然用 prometheus ,不过现在zabbix也支持监控k8s,要看模板的支持度能否满足自己的监控需要。 自己是做IT基础设施的,当然比较偏向zabbix,对硬件监控支持度更好、更全面。

收起
工业制造其它 · 2022-06-07
浏览1428
qiuhaovsqiuhaovs交互工程师北京科技有限公司
prometheus是最棒的方案,如果你python和go特别好的话,还可以做定制化。显示全部

prometheus是最棒的方案,如果你python和go特别好的话,还可以做定制化。

收起
软件开发 · 2022-06-07
浏览1456
xylonxiangxylonxiang运维经理湖南高阳通联
如果没有特殊要求,建议使用prometheus监控体系就可以了,只不过部署方案上可能是部署两套prometheus,一套在k8s集群外,一套在k8s集群内,通过prometheus联邦方式把监控数据集中到k8s集群外的prometheus中,再配置相应的监控告警规则。...显示全部

如果没有特殊要求,建议使用prometheus监控体系就可以了,只不过部署方案上可能是部署两套prometheus,一套在k8s集群外,一套在k8s集群内,通过prometheus联邦方式把监控数据集中到k8s集群外的prometheus中,再配置相应的监控告警规则。

收起
电信运营商 · 2022-06-07
浏览1524

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2022-05-30
  • 关注会员:12 人
  • 问题浏览:3906
  • 最近回答:2022-06-08
  • X社区推广