今天 , 突然间,dell emc的超融合服务器几乎连不上,cpu不高,内存不高,但iostat的等待超高,达到1000%以上,分布式存储估计炸了。连ls -l都显示io错误。
一小时后,vsan网络交换慢慢恢复,但速度仍然很慢,无法恢复到正常,有哪位仁兄遇到过类似问题。 NSX-T网络太复杂了
原厂检查了近6个月,最终连交换机都换了,故障依然,本人深深的对dell的技术感到怀疑,进来又买了Dell的Vmax存储(公司贪图便宜),放置27T数据,rman备份显示有坏道,但Dell所有工具都检查了,
显示正常,我再度晕倒。 Dell公司作为一家500强企业,有如此多的技术不靠谱,真的让人唏嘘。
检查下是否有部分硬盘发生故障?因为VSAN是vSAN通过使用分布式RAID来对数据进行管理和控制的,如果部分硬盘发生故障,会导致VSAN对故障盘的信息进行大规模的迁移和对RAID信息重新分配,必须等待迁移过程结束后才能慢慢恢复正常。这类故障会引起iostat非常繁忙。另外,现有VSAN网络是千兆还是万兆?建议至少使用万兆光进行组网,否则VSAN会变得非常缓慢。
收起