对于告警后的自动化处理要分两个层次考虑,一个就是在运维过程中我们总结出哪些报警一出现就知道100%这个问题,那我们才有可能进行自动化脚本处理,例如:weblogic的wlst脚本的ping,不通的话就可以重新启动服务等。另外一个层...
首先要有场景,把所有涉及到的设备、日志和业务指标都统一放到这个场景中(例如:xxxx应用场景:F5哪个端口,哪些Farm,主机的CPU、网络设备端口、日志关键字还有业务指标这些全部关联到这个场景),可以根据已有的规则就行报警,要是...
应用环境不断扩大,但是部署发布的规范标准是一定的,没有好的标准化不可能去应对未来的发展,对于部署和发布操作的脚本无非是操作行为逻辑和匹配u的数据来完成,抓住这些不变的通用的来应对变化的,把握会更大些。...
自动化运维的前提标准化,前期标准化不做充分了,后期就会出现手工,整体很难自动化,对于自动化部署或者运维首先列出要做的工作序列,然后针对每一项工作进行标准化,确定是手工还是自动化脚本,到时还涉及到序列工作的重组与合并...
我认为目前没有哪款产品的在场景上做的很好,一遇到问题,各专业人员各查各自的专业,好的场景设计是将这个系统或者场景所涉及到的基础设施设备、基础指标、性能指标和业务指标放在一起,一旦出现问题,所有专业的人就看哪部分...
风险就是不知道执行的是否成功,有了校验也不知道校验的是否完全和执行是否成功。一般有了执行脚本就会有校验脚本。所以一下几点值得注意:1、制定比较通用的校验架构,按脚本规范编写脚本利于脚本的校验;2、有一些像配置核...
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30