故障定位 - 主题 - twt企业IT交流平台

问题
热度排序 时间排序

生活生产服务其它query studio·2019-05-08

27 会员关注

这个问题比较难回答，首先我想知啊是否为了QS而看效率还是仅仅只是站在结果的角度看效率。QS是一个比较老的组件，监控效率是可以的，所有传到后台的并展示返回内容都可以用详细日志（trace log）的方式获取，只不过需要独立做一个开启详细日志的过程。这个日志叫ipfPERFclientperf，这...

赞同1

回答1

关注2

银行故障定位·2019-04-17

基于机器学习如何实现大量告警情况下精准的故障定位及根因分析？

pysx0503

· 第十区。散人　擅长领域：存储, 服务器, 备份

748 会员关注

计算机报警种类繁，报警的厂商不同。日志格式，内容还有代码也都没有一个统一标准。想要通过机器学习实现精准的故障定位我觉得还有很长的路要走。至少要所有的厂商都开放自己的日志代码。基本实现统一的日志格式。以目前的技术来看。我觉得机器学习只能是帮助运维去简化和梳...

证券一体化监控·2018-12-28

· 江西农信　擅长领域：存储, 灾备, 双活

1054 会员关注

我的想法是建立运维大数据平台，实时抓取不同数据源的监控数据，业务性能、网络性能、基础性能、事件、告警、日志等，一方面辅助运维人员在统一的视图进行问题排查与定位，另一方面，能够在统一的平台保留足够多的证据，为事后的问题原因分析，做数据支撑。建立起的运维大数据平台更进...

赞同9

回答1

关注2

证券故障定位·2018-12-27

如何避免因业务系统繁多复杂造成的问题定位困难？

jxnxsdengyu

· 江西农信　擅长领域：存储, 灾备, 双活

1054 会员关注

业务系统繁多，这时候清晰的IT架构可视化系统是很不错的选择，利用“IT架构图”与数据相互结合的方式，图可以分三类，一类是业务系统所在的网络架构，结合NPM的数据和流程数据，网络架构中的节点，可以关联CMDB的数据和NPM性能数据和告警数据等；二类是业务系统的业务逻辑架构，也就是该业...

赞同7

回答3

关注4

证券自动化运维·2018-10-17

对于硬件自动资产发现，故障自动发现系统平台，有没有好的思路？

nkj827 · 长春长信华天　擅长领域：存储, 灾备, 服务器

772 会员关注

对于硬件自动资产发现，故障自动发现需要运维系统配合监控系统使用。

赞同6

回答2

关注3

银行自动化运维·2018-09-25

面对应用与应用之间复杂的依赖和调用关系，如何快速定位排查问题？

mornsky · 某银行　擅长领域：系统运维, 自动化运维, 数据库

134 会员关注

在自动化运维中或相关的CMDB中可定义业务应用以及应用之间的关联，出现问题时通过查询相关业务应用，再依次查询相关应用日志和应用记录。应用日志最好做个统一的应用日志管理分析系统，可做更强大专业的日志分析。...

赞同2

回答2

关注3

互联网服务SAN（存储区域网络）·2017-12-23

SAN 环境的主机，存储，链路等故障快速定位手段与技巧？

powertiandi

· 李宁（中国）体育用品有限公司　擅长领域：存储, 服务器, 灾备

804 会员关注

分享几点故障诊断时的小经验：1.是否是一个普遍还是独立的问题，例如io问题例：曾经遇到一个集群环境下多节点主机io 性能下降，其中最终问题是由于ds8000 一个控制器问题导致。2.hba卡故障例：存储端出现告警灯亮，登录storage manager 查看，出现链路切换，由于有过类似经验，直接定位是...

赞同10

回答3

关注4

系统集成WebLogic·2017-11-10

weblogic 数据源连接延迟怎么排查？

swallowluo · 中国金融电子化公司　擅长领域：中间件, 服务器, 前置系统

389 会员关注

weblogic没有用过，看是标红的部分貌似是等待从连接池中获取数据库连接，不知道现在连接池的大小是多大，另外也要关注一下数据库端的最大连接数是多大

轻工业中间件·2017-11-10

swallowluo · 中国金融电子化公司　擅长领域：中间件, 服务器, 前置系统

389 会员关注

1、尽量把应用的日志设置为debug级别，以便输出更详细的日志信息，通过日志可以看到错误的堆栈信息，从而找到问题的原因；2、通过线程转储文件（Javacore）可以找到有问题的线程，并根据线程堆栈找到问题出现的原因；3、通过WAS的监控可以找到WAS自身的瓶颈（例如：线程池不足、连接池不足）。...

互联网服务性能优化·2017-11-09