故障处理
故障处理
该主题还没有描述

热点

故障分析·2021-08-12
penghuasheng广发证券 擅长领域:系统运维, 云计算, 监控
98 会员关注
TBF(无故障时长)和TTR(故障修复时长)是业务连续性管理两个重要指标,故障处置管理的目标就是为了最大限度的增加TBF和缩短TTR。在具体管理中,我们通常会根据故障应急处置时间轴扩展以下指标:MTBF(无故障时长)、MTTI(平均故障发现时长)、MTTK(故障定位时长)、MTTF(平均故障处理时长)、MTTR...(more)
专栏: 最佳实践
浏览4441
评论1
故障定位·2021-09-09
penghuasheng广发证券 擅长领域:系统运维, 云计算, 监控
98 会员关注
企业IT故障定位指诊断故障直接原因或根因,故障定位有助于故障恢复动作更加有效。故障定位通常是整个故障过程中耗时最长的环节,定位的目标围绕在快速恢复的基础上,而非寻找问题根因,后者由问题管理负责。通常大部分可用性故障,要借助运维专家经验的假设判断或已知预案的执行得...(more)
专栏: 最佳实践
浏览8006
分布式存储·2018-12-27
Lucien168地平线机器人 擅长领域:存储, 分布式系统, 分布式架构
91 会员关注
3.常见PG故障处理3.1PG无法达到CLEAN状态创建一个新集群后,PG的状态一直处于active,active+remapped或active+degraded状态,而无法达到active+clean状态,那很可能是你的配置有问题。你可能需要检查下集群中有关Pool、PG和CRUSH的配置项,做以适当的调整。一般来说,你的集群中需...(more)
浏览4008
评论2
系统集成故障处理·2019-02-22
zwz99999dcits 擅长领域:服务器, 存储, 灾备
1091 会员关注
应该是文件系统没空间了
系统集成ds5020·2019-02-14
abit2007代维 擅长领域:服务器, 存储, 灾备
272 会员关注
日志里面写的很清楚了,是温度问题。
系统集成IBM storwize v7000·2019-01-24
jxnxsdengyu江西农信 擅长领域:存储, 灾备, 双活
1049 会员关注
有RAID保护,在线更换对应的V7000硬盘即可。当然如果有热备盘,直接把改MDISK剔除,热备盘顶上后,等有了新硬盘,再更换故障硬盘,也可。
小型机·2019-01-20
匿名用户
收藏4
评价4
金币10
分布式存储·2018-12-26
Lucien168地平线机器人 擅长领域:存储, 分布式系统, 分布式架构
91 会员关注
2.常见OSD故障处理进行OSD排障前,先检查一下monitors和网络。如果cephhealth或ceph-s返回的是健康状态,这意味着monitors形成了法定人数。如果monitor还没达到法定人数、或者monitor状态错误,要先解决monitor的问题。核实下你的网络,确保它在正常运行,因为网络对OSD的运行和性...(more)
浏览1834
分布式存储·2018-12-25
Lucien168地平线机器人 擅长领域:存储, 分布式系统, 分布式架构
91 会员关注
1.常见MON故障处理Monitor维护着Ceph集群的信息,如果Monitor无法正常提供服务,那整个Ceph集群就不可访问。一般来说,在实际运行中,CephMonitor的个数是2n+1(n>=0)个,在线上至少3个,只要正常的节点数>=n+1,Ceph的Paxos算法就能保证系统的正常运行。所以,当Monitor出现故障的...(more)
浏览2220
评论1
轨道交通地铁云平台·2018-12-04
cuizengshun民生银行 擅长领域:云计算, 服务器, iaas
909 会员关注
操作系统AIX LINUX平台 openstack k8s网络 sdn vlan vxlan脚本python shell存储 集中式存储、分布式存储

描述

该主题还没有描述
X社区推广
  • 提问题