关于ceph节点down后,文件系统夯住的时间控制?

测试环境中,有6个osd节点,每个节点有24个osd;2个独立mds,3个mon节点;
双副本,在模拟节点故障的测试过程中,文件系统会夯住1分钟左右;
在这里想咨询一下各位大神,哪些参数可以控制文件系统的夯住时间,推荐时间是多少?在分布式的存储系统中,最短可以实现的目标时间是多少?

1回答

Lucien168Lucien168  存储工程师 , 滴滴
JNsnowyinxinmichael1983等赞同了此回答
有两种情况可以自动剔除客户:在活动的MDS守护程序上,如果客户端尚未通过mds_session_autoclose秒(默认为300秒)与MDS进行通信(客户端每隔20s 向mds发送心跳链接handle_client_session),则会自动将其逐出。 在MDS启动期间(包括故障转移),MDS通过称为重新连接的状态。 在此状态下,它...显示全部

有两种情况可以自动剔除客户:
在活动的MDS守护程序上,如果客户端尚未通过mds_session_autoclose秒(默认为300秒)与MDS进行通信(客户端每隔20s 向mds发送心跳链接handle_client_session),则会自动将其逐出。

在MDS启动期间(包括故障转移),MDS通过称为重新连接的状态。 在此状态下,它等待所有客户端连接到新的MDS守护程序。 如果任何客户端在时间窗口(mds_reconnect_timeout,默认值为45秒)内未能这样做,那么它们将被逐出。

调节mds session autoclose(默认300s)可以尽快释放异常会话,让其他客户端尽快可用。

收起
 2019-05-29
浏览446
aixchina 邀答

提问者

jjchen05存储工程师, TOYOU

问题状态

  • 发布时间:2019-05-29
  • 关注会员:2 人
  • 问题浏览:1125
  • 最近回答:2019-05-29
  • 关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
    © 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30