几点建议:
1.可以先将GM改为GM WITH CHANG VOLUME,这样即使中断了,也可以增量续传。
2.查看两个级联交换机级联端口的光功率(接收和发送),看是否有光衰现象。
3.对于本地两个存储的VDM,该现象不影响,只是影响异步的那份数据,但对整体存储性能无影响。
4.两套SVC的版本可以升级为一致,但问题应该不在这。
5.两套SAN交换机的版本可以升级为一致,差距有些大,有可能是问题的原因,需要结合第2点的判断。
先贴一下porterrshow和把怀疑有问题端口的portstatshow的输出。对于SAN SW,最新微码是7.4.x版本,现有版本有点低。另外,DH8的FC端口是8Gb还是16Gb的?
如果链路质量不稳定,响应时间经常超过80ms,会引起partnership中断。
我来暂时性的结个贴吧,因为这个问题后来又出现过几次,我们请电信的人员也做过相应的测试,结果并没有明显的改变,后来我请教了IBM的部分资深的专家,修改了几个参数,目前问题暂时得到了解决,因为每次链路断开有个周期性,所以不知道最终是不是一定好了,但是我感觉这次调优算是最优进展的一次调优,感谢各位兄弟的关注和各位老师的指导。
后来我在IBM SVC专家的建议下,在不影响现有服务稳定性的情况下,通过修改gmlinktolerance和gmmaxhostdelay参数,并将两地带宽叠加放大,同时将使用率从60%调整至100%,从SVC层面去降低链路抖动对现有GM镜像的影响,目前参数已经生效,我和韩工会密切关注运行状态,观察参数调整后,对镜像稳定的影响。
gm内部算法里面,这俩是容忍链路抖动时间的参数,比方原有值为30s,那么在这30s内,链路抖动超过15s,那么内部算法就判定异常,就会强制断开,在链路不稳定的情况下,值偏低就会容易断开,后来经过我们协商,将值设置为300s,这样取值样本时间会加长,以我们经验来看,这样能够提高内部算法对链路异常的容忍度。
收起