backfill和recovery的最优值 ceph在增加osd的时候会触发backfill,让数据得到平均,触发数据的迁移ceph在移除osd的时候需要在节点上进行数据的恢复,也有数据的迁移和生成 只要是集群里面有数据的变动就会有网卡流量,cpu,
分布式系统一般都是靠 分布式协议paxos算法或者Raft算法来保证集群的高可用性和可靠性,一般只要运维和监控的保障不会出现大问题。 数据不均衡:但是咱们在运维的过程中,会发现ceph的crush算法,会导致数据倾斜, 集群中
看看nginx日志,是不是后端状态吗码有问题。然后这个设置 proxy_next_upstream error timeout invalid_header http_500
首先来一段英文关于PG和PGP区别的解释: PG = Placement Group PGP = Placement Group for Placement purpose pg_num = number of placement groups mapped to an OSD When pg_num is increased for any pool, ever
通过ntp 然后进行监控, 如果不同步,集群也会出现告警提示。
一个反复出现的问题是 OSD 龟速或无响应。在深入性能问题前,你应该先确保不是其他故障。例如,确保你的网络运行正常、且 OSD 在运行,还要检查 OSD 是否被恢复流量拖住了。 Tip: 较新版本的 Ceph 能更好地处理恢复,可防止
首先看报什么错误, 然后根据问题,找对应的解决方案,一般网上都有对应的解决方案。 最后, 搞不定把详细的步骤和日志,帖到社区。
提示很清楚, 根据提示多检查步骤。
ping mon地址, 检查mon日志,是否有错误日志。
设置集群为维护模式, 避免有数据迁移的发生, 尽快恢复死机的机器, 重新拉起osd起来。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30