复杂运维场景下监控如何能做到分钟级定位故障

互联网化时代的运维,服务器规模较传统方式有了数量级的增长,业务模式也多样和复杂,传统基于底层基础设施的告警在故障发生时定位到具体原因,不同岗位之间对故障处理协作的效率也难以提高。如何能打造一个以快速定位为目的监控体系...显示全部

互联网化时代的运维,服务器规模较传统方式有了数量级的增长,业务模式也多样和复杂,传统基于底层基础设施的告警在故障发生时定位到具体原因,不同岗位之间对故障处理协作的效率也难以提高。如何能打造一个以快速定位为目的监控体系

收起
参与27

查看其它 3 个回答sams的回答

samssams系统架构师安信证券

不知道lz的意思是系统自动定位故障,还是提供足够方便的数据供运维人员定位?这可是两个完全不同的方向,如果是前者,我也很想知道,估计要出动alphago吧?

证券 · 2016-06-29
浏览2385
  • 如果是前者,主要还是要靠业务依赖链来做故障告警的收敛了。
    2016-06-29

回答者

sams
系统架构师安信证券
擅长领域: 监控一体化监控系统运维

sams 最近回答过的问题

回答状态

  • 发布时间:2016-06-29
  • 关注会员:7 人
  • 回答浏览:2385
  • X社区推广