首先是需要对事件和日志进行监控,同时需针对关键metric进行监控记录,事件及日志一般用于集群不可用的告警,metric主要用于提升存储系统性能,并发现潜在的性能隐患。推荐使用prometheus+grafana进行监控,官方是有ceph的exporter可以参考的。...
显示全部首先是需要对事件和日志进行监控,同时需针对关键metric进行监控记录,事件及日志一般用于集群不可用的告警,metric主要用于提升存储系统性能,并发现潜在的性能隐患。推荐使用prometheus+grafana进行监控,官方是有ceph的exporter可以参考的。
收起