目前的监控和运维似乎更注重横向的工作,比如网络层、应用层、数据层、存储层。但是忽视了业务在这几个层面的纵向分布及规律,往往业务出问题之后,会调集所有层面的人员一一进行排查,可能有的问题很快定位了,但是有些问题可能找了一大圈也定位不了问题在哪里。
其实本质上我认为是因为我们缺少通过各个层面的逻辑关系及数据分析建立起来的以业务为导向的IT环境的主动性发现体系。比如我们可能不曾关注过一个业务上的变化导致的网络、应用、数据、存储各个层面的数据波动状态,也不曾关注过应用层面的读写究竟影响到了哪些足够细粒度的数据变化。
解决这个问题,首先要有一个标准化的规划逻辑。没有逻辑的标准化,那么IT里面的每一个模块儿之间可能也就失去了标准化的逻辑关系定位。同时一些先进的工具、手段、方法也就无法发挥更好的作用。其次,要有一个不断的配置细化优化的过程在运维生命周期的始终。再有,我们需要借助一些工具来实现。