SVC远程异步镜像GM不定时中断?

53545670.jpg590636244.jpg1725449455.jpg2095677976.jpg有一个企业客户,两套SVC异地容灾架构,本地是后端是一台V7000,一台HDS vps 400做实时镜像,几十公里外的灾备机房一套SVC,后端一台V7000做异步镜像,两地链路距离相隔多余25KM,使用的是定制化的40公里长波模块做级联,两边都是...显示全部

53545670.jpg

53545670.jpg

590636244.jpg
590636244.jpg

1725449455.jpg
1725449455.jpg

2095677976.jpg
2095677976.jpg

有一个企业客户,两套SVC异地容灾架构,本地是后端是一台V7000,一台HDS vps 400做实时镜像,几十公里外的灾备机房一套SVC,后端一台V7000做异步镜像,两地链路距离相隔多余25KM,使用的是定制化的40公里长波模块做级联,两边都是博科交换机,生产是新48口的,灾备是利旧原有24口的,中间是两条电信2GB的裸光纤。
在使用了一段时间后,目前出现异步镜像不定期的中断情况。重新启动后,过段时间还是会中断。
SVC没有硬件告警,在光交上面查看情况,在porterrshow里面,灾备的光交上,连接SVC的几个端口误码率比较高,更换端口模块和光纤线后,报错情况有所缓解,但远程级联的端口报错依然存在。镜像不定时中断情况依然存在。
目前我有几方面的疑惑,希望和大家一起探讨,请大家帮忙一起看看:
1,光纤不稳定和抖动如何判定,如何查看;
2,SAN端口老是报错,在哪方面影响镜像;
3,由于各批次的设备为逐步上线,目前微码是否有大家遇到过的明显bug
本地SVC (CG8) 微码 7.5.0.6
异地SVC(DH8) 微码 7.6.0.1
本地SAN1 微码7.0.2c
本地SAN2 微码7.0.2c
灾备SAN1 微码6.4.1b
灾备SAN2 微码6.3.1a
4,目前伙伴的速率为2G的60%,镜像之间的速率为默认的50%,此配置需要做进一步调整吗?
请大家多帮忙看看,可能的问题出在哪里,我这里能够随时提供相关日志。

收起
参与27

查看其它 3 个回答peterzhu的回答

peterzhupeterzhu系统工程师江苏农信

我来暂时性的结个贴吧,因为这个问题后来又出现过几次,我们请电信的人员也做过相应的测试,结果并没有明显的改变,后来我请教了IBM的部分资深的专家,修改了几个参数,目前问题暂时得到了解决,因为每次链路断开有个周期性,所以不知道最终是不是一定好了,但是我感觉这次调优算是最优进展的一次调优,感谢各位兄弟的关注和各位老师的指导。

  后来我在IBM SVC专家的建议下,在不影响现有服务稳定性的情况下,通过修改gmlinktolerance和gmmaxhostdelay参数,并将两地带宽叠加放大,同时将使用率从60%调整至100%,从SVC层面去降低链路抖动对现有GM镜像的影响,目前参数已经生效,我和韩工会密切关注运行状态,观察参数调整后,对镜像稳定的影响。
gm内部算法里面,这俩是容忍链路抖动时间的参数,比方原有值为30s,那么在这30s内,链路抖动超过15s,那么内部算法就判定异常,就会强制断开,在链路不稳定的情况下,值偏低就会容易断开,后来经过我们协商,将值设置为300s,这样取值样本时间会加长,以我们经验来看,这样能够提高内部算法对链路异常的容忍度。
银行 · 2017-12-07
浏览2918

回答者

peterzhu
系统工程师江苏农信
擅长领域: 服务器系统管理存储

peterzhu 最近回答过的问题

回答状态

  • 发布时间:2017-12-07
  • 关注会员:4 人
  • 回答浏览:2918
  • X社区推广