某金融用户报表业务系统,IBM P750*2 HDS VSP PowerHA环境,由于批处理IO时间较长,用户新购置了一台HDS闪存阵列解决目前存储性能瓶颈问题,新存储加电上架规划配置一番后,用户识别新存储准备数据迁移等一系列的工作,就在cfgmgr扫盘时候,没反应了,发现IBM P750分区宕掉了。收集日志厂商一轮分析过后。发现一个细节被大家忽略了,导致今天的后果。
欢迎大家竞猜交流讨论,本周内公布原因.
cfgmgr -l 指定设备,我觉得会比较安全。
大家说的都是出现此类的问题的点了。这个案例好在用户当初考虑到了安全起见扫盘的是备机,没有对业务产生影响。实际原因也让我们深思,有些事情不能想当然.大家继续交流,明天公布原因
是不是cfgmgr扫描磁盘的时候,你新加的盘有点小多,导致扫描时间变长,而扫描设备会导致网络设备中断,最终触发导致HA发生切换,但又没切过去,系统guang~~~熄火了
这个牛X,cfgmgr 宕机,还是细节问题,比较难猜。磁盘锁的问题?
猜测是不是两边的存储都连接在了同一块HBA卡的两个口上面,
然后HA没有停就扫描的,那样扫描链路会断一下的样子。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30