故障处理
故障处理
该主题还没有描述

热点

故障分析·2021-08-12
penghuasheng · 广发证券 擅长领域:系统运维, 云计算, 监控
98 会员关注
TBF(无故障时长)和TTR(故障修复时长)是业务连续性管理两个重要指标,故障处置管理的目标就是为了最大限度的增加TBF和缩短TTR。在具体管理中,我们通常会根据故障应急处置时间轴扩展以下指标:MTBF(无故障时长)、MTTI(平均故障发现时长)、MTTK(故障定位时长)、MTTF(平均故障处理时长)、MTTR...(more)
专栏: 最佳实践
浏览4487
评论1
故障定位·2021-09-09
penghuasheng · 广发证券 擅长领域:系统运维, 云计算, 监控
98 会员关注
企业IT故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。通常大部分可用性故障,要借助运维专家经验的假设判断或已知预案的执行得...(more)
专栏: 最佳实践
浏览8053
容器云·2021-06-25
容器云大赛 · 容器云职业技能大赛组委会 擅长领域:云计算, 容器, 容器云
315 会员关注
收藏2
评价11
金币1
容器云·2020-06-22
容器云大赛 · 容器云职业技能大赛组委会 擅长领域:云计算, 容器, 容器云
315 会员关注
收藏19
评价77
金币1
Ceph·2018-12-27
Lucien168 · 地平线机器人 擅长领域:存储, 分布式系统, 分布式架构
91 会员关注
3.常见PG故障处理3.1PG无法达到CLEAN状态创建一个新集群后,PG的状态一直处于active,active+remapped或active+degraded状态,而无法达到active+clean状态,那很可能是你的配置有问题。你可能需要检查下集群中有关Pool、PG和CRUSH的配置项,做以适当的调整。一般来说,你的集群中需...(more)
浏览4053
评论2
系统集成故障处理·2019-02-22
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
应该是文件系统没空间了
系统集成ds5020·2019-02-14
abit2007 · 代维 擅长领域:服务器, 存储, 灾备
272 会员关注
日志里面写的很清楚了,是温度问题。
系统集成IBM storwize v7000·2019-01-24
jxnxsdengyu课题专家组 · 江西农信 擅长领域:存储, 灾备, 双活
1053 会员关注
有RAID保护,在线更换对应的V7000硬盘即可。当然如果有热备盘,直接把改MDISK剔除,热备盘顶上后,等有了新硬盘,再更换故障硬盘,也可。
小型机·2019-01-20
匿名用户
收藏6
评价5
金币10
Ceph·2018-12-26
Lucien168 · 地平线机器人 擅长领域:存储, 分布式系统, 分布式架构
91 会员关注
2.常见OSD故障处理进行OSD排障前,先检查一下monitors和网络。如果cephhealth或ceph-s返回的是健康状态,这意味着monitors形成了法定人数。如果monitor还没达到法定人数、或者monitor状态错误,要先解决monitor的问题。核实下你的网络,确保它在正常运行,因为网络对OSD的运行和性...(more)
浏览1856

描述

该主题还没有描述
X社区推广
  • 提问题