当主机出现IO问题时,存储该如何“自证清白“?

我们存储管理员在日常生产运维中经常会碰到这样的情况,主机端反应IO慢,应用负责人首先向存储管理员发难:“是不是存储有问题?”那么作为存储管理员,该如何下手去分析问题,定位问题呢?我们都知道主机到存储的IO经过主机板卡、交换机、存储,中间任一环节,甚至包括线路都有可能造成主...显示全部

我们存储管理员在日常生产运维中经常会碰到这样的情况,主机端反应IO慢,应用负责人首先向存储管理员发难:“是不是存储有问题?”那么作为存储管理员,该如何下手去分析问题,定位问题呢?
我们都知道主机到存储的IO经过主机板卡、交换机、存储,中间任一环节,甚至包括线路都有可能造成主机端IO慢。而存储端的监控基本是控制器、存储池、端口的整体监控,而且往往看到的性能数据是一个结果而非原因,那么该如何从存储监控的这些数据中提炼出和某个主机相关的能反映或者推测出主机端IO慢的原因的蛛丝马迹,从而确认问题和存储端无关呢?

收起
参与20

查看其它 3 个回答pysx0503的回答

pysx0503pysx0503系统工程师第十区。散人

这个问题很好。好多环节其实都存在这种问题。,软件,硬件。网络都存在这种互相推诿。需要自证清白的情况。信息化到现在每一个环节结合都很紧密。
如果单纯的想要资政清白。其实无非就是从生产环境下断下来。独立运行测试怀疑的性能。但对于现在的信息化系统来说。很多时候这种情况无法做到。所以我觉得出现问题的时候首要的一个原则是各个部门先不要主管的判断是对方的问题。这个态度很关键。共同从各自的角度分析。互相配合。才可能更快的分析问题
以主机和存储为例,当主机端反映IO缓慢。可以从及几部分来验证。主机端。进行对主机本地的存储进行读写测试。对比在存储上的IO。判断是否是主机性能本身的问题。存储段。可以对比与其他主机之间的IO读写看看是否是单节点主机的问题。有条件的话可以跨过SAN交换机。单独接入新主机。来排除线路与san网络之间的问题。
互相配合。逐级替换,测试应该可以更有助于找到问题的根本。

系统集成 · 2021-01-13
浏览1603

回答者

pysx0503
pysx0503153369
系统工程师第十区。散人
擅长领域: 存储备份服务器

pysx0503 最近回答过的问题

回答状态

  • 发布时间:2021-01-13
  • 关注会员:5 人
  • 回答浏览:1603
  • X社区推广