背景:目前企业已经有类似BMC这这中传统的监控和告警平台,但是企业容器平台自带promethus监控,云管平台本身也会从VMWARE等不同云平台收集监控和告警信息。
问题:监控系统是否需要统一吗?
最好运维的头等大事可以说是监控了,没有监控犹如人无双眼,那是不是说有监控就能万事大吉了呢,显示不是。大量的无效告警,重复告警,如果不能很好的设置规则,那么监控给你带来的烦恼也是问题诸多,反而会拖累整体运维工作。
不管哪家的云管平台产品均是有所监控的,但是这个监控范围和整体可控性,应该来说没有统一的监控产品兼顾的那么周全,否则就要在云管平台上做大量的二开,工作量和投入也不小。
为了有利于整体的运维和后期的持续性,应该结合企业自身的具体需求,维护好一个开源或者商业产品监控解决方案,作为监控的统一入口,不断的更新迭代,一段时期下来企业就会积累很多经验,后期的运维也会更加的自如。
以上是个人的一点建议,仅供参考。