在用户运维过程中,如何结合使用自动化工具比如ansible或zabbix监控,按照既定的配置策略和脚本智能告警并且自动处理解决一些普通故障,并通过微信自动发送报告处理结果到相关人员?
比如检测到文件系统达到90%以上,自动触发zabbix告警(微信告警到相关人员),然后智能化自动按照既定策略自动扩容文件系统使得空间满足到80%以下(在自动判断存储空间足够的情况下),或者发现系统CPU 内存在没有批处理业务的情况下,占用突然异常很高,自动停止或重启占用最高的进程,并通过微信自动发送报告处理结果到相关人员。
收起