这个问题比较难回答,首先我想知啊是否为了QS而看效率还是仅仅只是站在结果的角度看效率。QS是一个比较老的组件,监控效率是可以的,所有传到后台的并展示返回内容都可以用详细日志(trace log)的方式获取,只不过需要独立做一个开启详细日志的过程。这个日志叫ipfPERFclientperf,这...
计算机报警种类繁,报警的厂商不同。日志格式,内容还有代码也都没有一个统一标准。想要通过机器学习实现精准的故障定位我觉得还有很长的路要走。至少要所有的厂商都开放自己的日志代码。基本实现统一的日志格式。以目前的技术来看。我觉得机器学习只能是帮助运维去简化和梳...
我的想法是建立运维大数据平台,实时抓取不同数据源的监控数据,业务性能、网络性能、基础性能、事件、告警、日志等,一方面辅助运维人员在统一的视图进行问题排查与定位,另一方面,能够在统一的平台保留足够多的证据,为事后的问题原因分析,做数据支撑。建立起的运维大数据平台更进...
业务系统繁多,这时候清晰的IT架构可视化系统是很不错的选择,利用“IT架构图”与数据相互结合的方式,图可以分三类,一类是业务系统所在的网络架构,结合NPM的数据和流程数据,网络架构中的节点,可以关联CMDB的数据和NPM性能数据和告警数据等;二类是业务系统的业务逻辑架构,也就是该业...
对于硬件自动资产发现,故障自动发现需要运维系统配合监控系统使用。
在自动化运维中或相关的CMDB中可定义业务应用以及应用之间的关联,出现问题时通过查询相关业务应用,再依次查询相关应用日志和应用记录。应用日志最好做个统一的应用日志管理分析系统,可做更强大专业的日志分析。...
分享几点故障诊断时的小经验:1.是否是一个普遍还是独立的问题,例如io问题例:曾经遇到一个集群环境下多节点主机io 性能下降,其中最终问题是由于ds8000 一个控制器问题导致。2.hba卡故障例:存储端出现告警灯亮,登录storage manager 查看,出现链路切换,由于有过类似经验,直接定位是...
weblogic没有用过,看是标红的部分貌似是等待从连接池中获取数据库连接,不知道现在连接池的大小是多大,另外也要关注一下数据库端的最大连接数是多大
1、尽量把应用的日志设置为debug级别,以便输出更详细的日志信息,通过日志可以看到错误的堆栈信息,从而找到问题的原因;2、通过线程转储文件(Javacore)可以找到有问题的线程,并根据线程堆栈找到问题出现的原因;3、通过WAS的监控可以找到WAS自身的瓶颈(例如:线程池不足、连接池不足)。...
经本人实地调研发现,运维监控、甚至是专门的性能测试中,最容易漏掉监控的就是“应用中间件”和“存储”。往往是出了问题,把所有可能怀疑遍了,也没发现什么可疑之处,比如cpu利用率不高、网络带宽占用率很低、读写磁盘IOPS不多、数据库响应时间很短,应用的并发数量也充足,可就是...