案例3 AIX cfgmgr扫描新磁盘,哐当一下,业务系统宕机

某金融用户报表业务系统,IBM P750*2 HDS VSP PowerHA环境,由于批处理IO时间较长,用户新购置了一台HDS闪存阵列解决目前存储性能瓶颈问题,新存储加电上架规划配置一番后,用户识别新存储准备数据迁移等一系列的工作,就在cfgmgr扫盘时候,没反应了,发现IBM P750分区宕掉了。收集日志厂商一轮分析过后。发现一个细节被大家忽略了,导致今天的后果。

欢迎大家竞猜交流讨论,本周内公布原因.

参与108

15同行回答

wangs0717wangs0717系统工程师Teamsun
cfgmgr -l  指定设备,我觉得会比较安全。显示全部

cfgmgr -l  指定设备,我觉得会比较安全。

收起
IT咨询服务 · 2016-11-29
浏览12457
myciciymyciciyIT顾问某金融科技公司
大家说的都是出现此类的问题的点了。这个案例好在用户当初考虑到了安全起见扫盘的是备机,没有对业务产生影响。实际原因也让我们深思,有些事情不能想当然.大家继续交流,明天公布原因...显示全部

大家说的都是出现此类的问题的点了。这个案例好在用户当初考虑到了安全起见扫盘的是备机,没有对业务产生影响。实际原因也让我们深思,有些事情不能想当然.大家继续交流,明天公布原因

收起
银行 · 2016-11-29
浏览12220
mmsc5166mmsc5166系统工程师某金融公司信息技术中心
是不是cfgmgr扫描磁盘的时候,你新加的盘有点小多,导致扫描时间变长,而扫描设备会导致网络设备中断,最终触发导致HA发生切换,但又没切过去,系统guang~~~熄火了显示全部

是不是cfgmgr扫描磁盘的时候,你新加的盘有点小多,导致扫描时间变长,而扫描设备会导致网络设备中断,最终触发导致HA发生切换,但又没切过去,系统guang~~~熄火了

收起
金融其它 · 2016-11-29
浏览12394
老么老么系统工程师mbi
这个牛X,cfgmgr 宕机,还是细节问题,比较难猜。磁盘锁的问题?显示全部

这个牛X,cfgmgr 宕机,还是细节问题,比较难猜。磁盘锁的问题?

收起
互联网服务 · 2016-11-28
浏览7112
neilruleneilrule系统运维工程师zhou
猜测是不是两边的存储都连接在了同一块HBA卡的两个口上面,然后HA没有停就扫描的,那样扫描链路会断一下的样子。显示全部

猜测是不是两边的存储都连接在了同一块HBA卡的两个口上面,

然后HA没有停就扫描的,那样扫描链路会断一下的样子。

收起
金融其它 · 2016-11-28
浏览12868

提问者

myciciy
myciciy21035
IT顾问某金融科技公司
擅长领域: 服务器存储灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2016-11-28
  • 关注会员:29 人
  • 问题浏览:27225
  • 最近回答:2016-12-19
  • X社区推广