SAN环境下经常出现的问题有链路切换,不在最优路径,hba卡故障,配线架无光传输,sfp模块灯不亮,san telnet 不能登录,链路性能下降等等,这些都是工作当中常见问题,如何快速定位问题,又有那些经验可以借鉴,你曾经遇到过那些问题,欢迎交流探讨。
收起分享几点故障诊断时的小经验:
1.是否是一个普遍还是独立的问题,例如io问题
例:
曾经遇到一个集群环境下多节点主机io 性能下降,其中最终问题是由于ds8000 一个控制器问题导致。
2.hba卡故障
例:
存储端出现告警灯亮,登录storage manager 查看,出现链路切换,由于有过类似经验,直接定位是由于vmware 集群端主机其中hba卡异常导致,直接查看链路状态和hba卡硬件状态,配合查看交换机端口,很快就能定位故障hba