关于ceph节点down后,文件系统夯住的时间控制?

测试环境中,有6个osd节点,每个节点有24个osd;2个独立mds,3个mon节点;
双副本,在模拟节点故障的测试过程中,文件系统会夯住1分钟左右;
在这里想咨询一下各位大神,哪些参数可以控制文件系统的夯住时间,推荐时间是多少?在分布式的存储系统中,最短可以实现的目标时间是多少?

参与11

1同行回答

Lucien168Lucien168  存储工程师 , 地平线机器人
有两种情况可以自动剔除客户:在活动的MDS守护程序上,如果客户端尚未通过mds_session_autoclose秒(默认为300秒)与MDS进行通信(客户端每隔20s 向mds发送心跳链接handle_client_session),则会自动将其逐出。在MDS启动期间(包括故障转移),MDS通过称为重新连接的状态。 在此状态下,它...显示全部

有两种情况可以自动剔除客户:
在活动的MDS守护程序上,如果客户端尚未通过mds_session_autoclose秒(默认为300秒)与MDS进行通信(客户端每隔20s 向mds发送心跳链接handle_client_session),则会自动将其逐出。

在MDS启动期间(包括故障转移),MDS通过称为重新连接的状态。 在此状态下,它等待所有客户端连接到新的MDS守护程序。 如果任何客户端在时间窗口(mds_reconnect_timeout,默认值为45秒)内未能这样做,那么它们将被逐出。

调节mds session autoclose(默认300s)可以尽快释放异常会话,让其他客户端尽快可用。

收起
互联网服务 · 2019-05-29

提问者

jjchen05
存储工程师TOYOU

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-05-29
  • 关注会员:2 人
  • 问题浏览:3632
  • 最近回答:2019-05-29
  • X社区推广