1、目前splunk与elk在市场的占有份额是怎样的。
2、在实时性上,splunk与elk上是如何实现的。
3、对数据格式的二次处理各工具都是如何实现的。
4、针对elk以及Saprk、Hadoop的维护难度及技术支持如何实现
在互联网界,ELK基本已经成为运维标配工具了。
实时性上,二者是一致的。
对数据格式的二次处理,splunk是在indexing time索引少量字段,search time动态提取需要用到字段;ELK是在indexing之前提取好全部字段,search的时候直接使用。
维护难度上,elk、spark、hadoop都是分布式系统。都少不了一些分布式系统的难处。一个区别在于,es是基于gossip的,类似P2P式,没有一个很重的元数据维护的master,hadoop是需要有一个放元数据的master的。这方面来说es的维护难度稍微低一点点。不过hadoop十年多,社区积累的维护经验又比es多。