故障自愈
故障自愈
该主题还没有描述

问题

互联网服务自动化运维·2021-11-17
沈天真 · IPS 擅长领域:服务器, 云计算, 存储
13 会员关注
个人感觉,除非能从告警信息或者其他信息中完全确定故障原因,可以采取一些自愈措施,稍微复杂的都要慎重。细节的地方太多,例如可能某个优先级高的服务抢占了资源,或者调用链依赖的某个服务故障,导致另外一个服务起不来,但是如果此时用自愈脚本反复去启动,是不是永远没有效果,可能连...
银行机器学习·2018-09-27
zjwy82 · bank 擅长领域:系统运维, 自动化运维, 银行自动化运维
57 会员关注
智能运维是一个大的话题,gartner提出将现有的AIOps能力划分为11个类别(可以百度一下),要实现智能运维需要一个体系化的系统建设规划,结合实际需求分应用场景实现,不建议随风涌动。机器学习是实现智能运维中某些场景的技术手段之一,大数据、自动化都是智能运维中不可或缺的手段。...

    描述

    该主题还没有描述
    X社区推广
  • 提问题