故障自愈能力首先依赖于整体架构的高可用性,架构高可用时已具备基本的故障自愈能力。同时在运维过程中可以逐步梳理故障对应的监控告警以及标准化的处理流程,并将这些处理流程自动化后配置在类似zabbix这种监控工具或者...
核心数据库存储使用分布式存储还是集中式存储建议参考数据库架构,数据库如果使用传统db2,oracle这些,那么建议继续使用传统集中式存储;如果核心数据库使用tdsql等这种分布式数据库,其一般是使用服务器本地盘,数据库已具备对...
我的理解是pgp用于承载pg,建议保持pg和pgp一致,调整pg数目时会进行pg内对象分裂,调整pgp时会引起pg重分布。
集群内配置ntp服务器,其他节点从这里同步时间即可。或者集群配置公司通用的ntp服务器也可以,如果有的话。
检查下集群是否存在slow request,如果存在的话可以看一下集中在哪些osd,这些osd是否硬盘故障或者网络中断,将这些osd踢出集群是否可以恢复。
一般报错的提示都是比较明晰的,按照提示处理就可以了。
crushmap和实际osd对不上,实际没有osd2,却在crushmap里出现了,需要更新下crushmap或者创建下osd2。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30