饶琛琳

饶琛琳

《ELKstack权威指南》作者,擅长日志分析、机器学习、智能运维、监控、故障定位等。

动态

通过开发语言实现运维自动化,哪种语言比较好?怎么抉择?

饶琛琳 饶琛琳 产品总监,日志易
应该先按照自己规划的技术栈来挑选对应的开源软件,然后针对性的选择二次开发的语言。毕竟我们运维的目的是快速达到目标而不是写一个NB的新软件出来。所以,如果配管方面你选了ansible你就应该用python,选了puppet就应该查看全文
自动化运维 日志分析 日志管理 饶琛琳饶琛琳 回答了问题 2017-03-23

日常企业中日志管理是如何运维管理的?

饶琛琳 饶琛琳 产品总监,日志易
有啊。而且很多。将日志统一收集管理分析,进而做到对不同日志的关联分析,主动告警,是运维工作的一个重要部分。商业的,开源的,都有。查看全文
监控 故障定位 证券一体化监控 饶琛琳饶琛琳 回复了回答 2016-06-29

复杂运维场景下监控如何能做到分钟级定位故障

饶琛琳 饶琛琳 产品总监,日志易
如果是前者,主要还是要靠业务依赖链来做故障告警的收敛了。查看全文
监控 数据抓取 证券一体化监控 饶琛琳饶琛琳 赞同了回答 2016-06-29

对于庞大的系统(需要监控节点上万),如何抓取数据才能减少对网络的压力?

jianghenglz jianghenglz 系统工程师,奇安信集团
对于数万台级别的系统,建议建议一套监控网络,这套网络专门用于监控,也可利用管理网络进行监控,避开与生产网络共用查看全文
自动化监控 证券一体化监控 饶琛琳饶琛琳 回复了回答 2016-06-29

一体化监控是否能够趋势分析

饶琛琳 饶琛琳 产品总监,日志易
elasticsearch2.x有提供pipeline aggregation API,对应在kibana里有一个timelion app。可以对时序数列做forecast。查看全文
日志监控 证券一体化监控 饶琛琳饶琛琳 回答了问题 2016-06-29

如何进行大文件日志内容监控?

饶琛琳 饶琛琳 产品总监,日志易
不安装agent和实时需求之间是有一定权衡取舍的。比如说scp、rsync这些命令,其实也算是一种agent(sshd和rsyncd)。用Perl之类服务器自带脚本语言写一个daemon实时传日志,这个daemon也是一种agent。所以在有实时需求的时候,查看全文
平台架构 饶琛琳饶琛琳 回答了问题 2016-06-02

当数据量达到TB级以上,如何避免平台架构出现性能瓶颈?

饶琛琳 饶琛琳 产品总监,日志易
最重要的是选一个本身就方便横向扩展的分布式架构。靠纵向扩展,CPU、IOPS等等总是有上限的。但是横向扩展就比较方便了。查看全文
日志分析 饶琛琳饶琛琳 回答了问题 2016-06-02

从服务器获取日志信息,存在风险如何解决?

饶琛琳 饶琛琳 产品总监,日志易
看了一眼题主的描述。仅指『系统日志』的话,完全可以配置一下syslog对外转发,外部UDP、TCP接收转发出来的日志即可。毕竟rsyslogd是默认程序,转不转发都要运行的,不算额外负载,对吧~性能方面完全放心,我在新浪微博做日志系查看全文
运维大数据 饶琛琳饶琛琳 回答了问题 2016-06-02

运维大数据如何清洗

饶琛琳 饶琛琳 产品总监,日志易
这个问题太宽泛了吧。hadoop、spark、elk,所有技术都可以做到。关键还是看你的需求偏向。查看全文
饶琛琳饶琛琳 回答了问题 2016-06-02

日志的采集方式

饶琛琳 饶琛琳 产品总监,日志易
一般来说,安装一个agent会比较方便。如果不方便安装agent的,那么通过log4j的socketappender啊,syslog的远程转发啊,也是可以直接远程收集的。采用日志方式,而不是apm等方式,优势就是对应用本身没什么影响。记日志是顺序写,读查看全文

趋势项目产品选型优先顺序调查

发表您的选型观点,参与即得金币

擅长领域

日志分析 日志分析