自动化运维工具有哪些方式实现故障的准确定位?

参与11

3同行回答

nkj827nkj827  项目经理 , 长春长信华天
一个小小的故障出现必将引起数十个甚至上百的设备报警,那么现阶段的自动化运维软件能够把故障定位精确到什么程度?还是仅仅能做到提示,真正的故障原因还需要运维人员自己去手动找? 故障定位算法采用机器学习中的二叉决策树的方式实现: 一方面希望将故障所产生的所有告警信息...显示全部

一个小小的故障出现必将引起数十个甚至上百的设备报警,那么现阶段的自动化运维软件能够把故障定位精确到什么程度?还是仅仅能做到提示,真正的故障原因还需要运维人员自己去手动找?
故障定位算法采用机器学习中的二叉决策树的方式实现: 一方面希望将故障所产生的所有告警信息整合为一条信息,减少告警量; 另一方面希望能够智能定位出故障点,减少工程师排查问题的时间,并引入自动化处理。
以网络故障原因定位为例,实现上述目标需要三步: 第一步:将问题排障过程的经验提炼成二叉决策树; 第二步:将告警信息按照时间分片算法进行分类分组; 第三步:将分组的告警信息输出给决策树进行自动推理输出推理结果。 智能定位出故障点,尽可能减少人工参与,提高运维效率。

收起
系统集成 · 2021-04-09
浏览1603
hebejiahebejia  系统运维工程师 , 农信银
在大多数单位目前阶段自动化运维只是执行的工具,做一些标准的自动化动作。制订标准-检查系统运行情况是否符合标准,根据预设的去执行动作,还远未达到智能运维的美好愿望。分析的“大脑”还未健全...显示全部

在大多数单位目前阶段自动化运维只是执行的工具,做一些标准的自动化动作。制订标准-检查系统运行情况是否符合标准,根据预设的去执行动作,还远未达到智能运维的美好愿望。分析的“大脑”还未健全

收起
银行 · 2021-04-20
浏览1342
asdf-asdfasdf-asdf  研究学者 , cloudstone
设备的全面健康检查状态对比巡检脚本的指标巡检完善度同比类比,和趋势对比准确定位目前需要专家分析目前情况  代码的稳定程度和it基础架构的稳定程度  相对完善出现问题,一般会实现故障转移,  给我们时间进行故障分析避免再次发生...显示全部

设备的全面健康检查状态对比
巡检脚本的指标巡检完善度
同比类比,和趋势对比
准确定位目前需要专家分析
目前情况  代码的稳定程度和it基础架构的稳定程度  相对完善
出现问题,一般会实现故障转移,  给我们时间进行故障分析避免再次发生

收起
软件开发 · 2021-04-13
浏览1531

提问者

chenlii
系统架构师某券商
擅长领域: 服务器云计算数据库

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2021-04-09
  • 关注会员:4 人
  • 问题浏览:2819
  • 最近回答:2021-04-20
  • X社区推广