该节点和monitor节点网络通讯异常的概率比较大,可以测一下到monitor的端口通不通。
从硬件配置选择,到bios-raid-os-ceph各层配置均按照社区建议方案进行调整,如果时间允许,可以对各参数进行压测以获得最佳配置。
建议结合业务需求来进行扩容,覆盖业务需求后容量使用情况在50%左右为宜,即可以避免大量空间冗余浪费,也可以避免频繁扩容。
从存储端-网络端-客户端逐层排查。首先确认慢是普遍慢还是个别客户端慢,个别客户端的负载如何,到存储端的网络路径和其他客户端相比如何,存储端是否有网络打满的情况,是否有不健康的磁盘,可以按照这种思路逐个去排查。...
首先是需要对事件和日志进行监控,同时需针对关键metric进行监控记录,事件及日志一般用于集群不可用的告警,metric主要用于提升存储系统性能,并发现潜在的性能隐患。推荐使用prometheus+grafana进行监控,官方是有ceph的expo...
调整pg数目时会发生大量pg分裂迁移,建议在业务低峰期进行并做好恢复带宽限制。如果集群不能一次规划建设到位的话建议按照官方算法按照每次扩容完成后的总osd数目进行调整以获得最佳配比。...
可以限制重平衡的io数目和重平衡的io带宽减少对正常业务io的影响,或者只在业务低峰期打开重平衡。
首先是要控制存储的分配情况,避免超分比过多,如果单个磁盘使用过多时,建议优先进行集群的整体扩容,将整体使用率降下来,使用率较低时集群的稳定性会更好。如果是在开发测试环境这种不太重要的用途上,可以配置osd定期自动rew...
建议在规划存储池时对存储池的规模容量做好规划,一次建设完成,以避免对现有存储池的扩容,现有存储池扩容时会发生大量的数据迁移,迁移整体耗时会较长,如果必须扩容的话,可以提前评估业务低峰窗口,并限制数据平衡速率,在扩容完...
规模扩大和业务扩张是一个过程,在这个过程中建议加强对网络和磁盘IO这些容易出现问题的点的监控并进行历史趋势分析,从趋势中发现性能容量的瓶颈,并尽量将瓶颈提前消灭掉。...
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30