其实就数据库或者服务器而言,我们有时候会感到困惑,不知道巡检哪些东西,机器太多麻烦,生成可视化报告太困难,无法直观呈现结果等
一般化我们会分成三个日常巡检,季度巡检,年度巡检
日常巡检
状态检查
数据库状态检查,服务器状态检查
服务器
处理器、物理内存、磁盘、网卡等详细信息
数据库层面
文件大小、配置信息、空间等
季度巡检
年度巡检
日常的巡检是比较偏业务层面的,保证业务的连续性,季度和年度的巡检比较偏配置这块,一个是机器的负载,数据库的负载,为后期扩容情况的做一些依据等
根据以上一些基础信息做成你自己的小工具,同时做好记录,如果有什么需要的可以随时加进去定制化,当然也可以使用一些现成的产品或者工具加上定制化的工具,主要是需要有这样一个意识,正常的监控大家都会做,定期的巡检做的并不多,很多问题我们可以通过对定期巡检的记录对比发现一些潜在的问题。