运维数据可视化和可分析化

运维数据的可视化一直以来都是各家运维工具追求的目标。大家做的也是各有各的特色,但是对于历史运维数据的分析这一块很多工具都没有做到,现在有没有自动去分析和统计历史运维数据的一些产品。和解决方案?...显示全部

运维数据的可视化一直以来都是各家运维工具追求的目标。大家做的也是各有各的特色,但是对于历史运维数据的分析这一块很多工具都没有做到,现在有没有自动去分析和统计历史运维数据的一些产品。和解决方案?

收起
参与13

查看其它 1 个回答galaxy1975的回答

galaxy1975galaxy1975系统架构师自动化运维专家

可视化和可分析化是2个问题,我们先说可分析化

可分析,分析的基础是数据,实际上就是我们通常所讲的运维大数据,我们还是基于企业的组织架构来说

1. 基础平台运维

2. 业务软件运维

他们的关注点不同,那么对分析的要求是不同的,我们分开来说

1. 基础平台运维:

更多的是关注容量是否够用,硬件性能是否够快,时髦的名词就是“容量管理”。这个可以大幅降低企业的IT预算。同时,还关注是否有隐藏故障、运行隐患。

那么,需要收集的数据就主要是和“硬件”相关的数据了,比如,CPU内存IO,还有系统运行日志等等。传统的Zabbix基本上可以满足这一类的需求。

另外,基础平台运维可以变身为管理部门,提供每一个业务系统的资源使用成本分析,为企业决策提供依据。这个就要有用量数据和用量分析。

2. 业务软件运维:

业务软件才不管你摞多少台服务器,他们只管业务跑的好不好,这个好,用2个层面来看,第一就是是否稳定功能不出错,第二就是客户体验是否优秀,第一以前也是用zabbix等监控软件实现的,现在更多关注客户体验,以及一些业务系统运行过程中的隐含故障,首先做业务系统的日志规范,例如同一笔交易统一ID,交易延迟的监控等等,冒出来的解决方案有类似于ELK的日志工具,还有APM工具等。


第二个就是可视化

可视化的意思是,任何操作、任何数据都可以用简单形象的方法看到并且有历史保存(实际上就是一个基于Web的平台),这里面,监控的好办,现在企业都在做操作层面的可视化,比如你要启动一个服务,可以通过平台来启动,然后你可以查看到这个任务的启动时间、执行人、结束时间等等。我见过做的比较牛的是把整个容灾切换的过程做成了可视化一键式操作,监控整个容灾切换的过程,很coll

第二个就是我们常说的大屏,把关注的信息投放到大屏上,这部分和自动化运维无关,主要就是一个展示,领导喜欢看这个

IT咨询服务 · 2016-06-17
浏览2451

回答者

galaxy1975
系统架构师自动化运维专家

galaxy1975 最近回答过的问题

回答状态

  • 发布时间:2016-06-17
  • 关注会员:5 人
  • 回答浏览:2451
  • X社区推广