测试环境中,有6个osd节点,每个节点有24个osd;2个独立mds,3个mon节点;
双副本,在模拟节点故障的测试过程中,文件系统会夯住1分钟左右;
在这里想咨询一下各位大神,哪些参数可以控制文件系统的夯住时间,推荐时间是多少?在分布式的存储系统中,最短可以实现的目标时间是多少?
有两种情况可以自动剔除客户:
在活动的MDS守护程序上,如果客户端尚未通过mds_session_autoclose秒(默认为300秒)与MDS进行通信(客户端每隔20s 向mds发送心跳链接handle_client_session),则会自动将其逐出。
在MDS启动期间(包括故障转移),MDS通过称为重新连接的状态。 在此状态下,它等待所有客户端连接到新的MDS守护程序。 如果任何客户端在时间窗口(mds_reconnect_timeout,默认值为45秒)内未能这样做,那么它们将被逐出。
调节mds session autoclose(默认300s)可以尽快释放异常会话,让其他客户端尽快可用。
收起