VMware 虚拟化HA集群环境频繁出现网络异常,重启后恢复,帮忙分析一下是什么故障原因?

       VMWARE 虚拟化 HA集群环境频繁出现网络异常重启恢复,这是在实施后的两年之后出现的问题.       环境:物理服务器4台ESXi,两个集群环境,共享存储一台,一直都是正常运行的,突然有一天就出现网络问题,宿主机无法访问,业务中断,重启ES...显示全部

       VMWARE 虚拟化 HA集群环境频繁出现网络异常重启恢复,这是在实施后的两年之后出现的问题.

       环境:物理服务器4台ESXi,两个集群环境,共享存储一台,一直都是正常运行的,突然有一天就出现网络问题,宿主机无法访问,业务中断,重启ESXi主机后,网络恢复,问题消失。

       由于访问量较大,物理网卡一直处于工作状态,可所有硬件设备状态完好,日志无明显报错,问题在出现过第一次后,反复出现,只要一重启主机,问题恢复,间隔3-4天就出现一次。无法通过日志找到原因。

       联系vmware原厂,原厂说需要升级exsi版本,和服务器硬件微码。最后升级了服务器硬件微码,和exsi版本。结果只隔了一天,问题又一次出现了。

       这次并不是所有的网络都阻断,管理地址未中断,但是虚拟机任然无法连通,业务中断。在这之后,做过网络调整,管理网络和虚拟机业务网络分配到不通标准交换机中,问题出现时,同一个标准交换机内的虚拟机出现部分可以出去,外部可以访问,部分虚拟机出现网络配置中网关丢失现象,手动配置网关,依旧无法出去。

       重启虚拟机之后,部分网络会中断,部分能通。还是需要重启所有ESXi主机,才能恢复。现在ESXi版本已经是5.5.643,微码版本已经是4.0.596,服务器微码也已经升级完成。5.5 U3,问题依旧,现在只能先进行网卡硬件更换,HP NC365T,网卡驱动已经包含在vmwarelinux中,自带。不需要额外打驱动。问题无法定位。

       向各位高手大神求助,哪位能帮忙分析一下这个问题的可能性原因是什么?

收起
参与43

查看其它 5 个回答丁涛的回答

丁涛丁涛it技术咨询顾问fit2cloud

我在华为虚拟化平台遇到类似的问题,是不是交换机和VMware平台的虚拟网卡绑定模式有关?

互联网服务 · 2016-12-30
浏览7069
  • 如果和网卡绑定模式有关,如何做到未做任何调整的情况下,稳定运行2年,突然出现问题?
    2016-12-30
  • 基于源虚拟端口ID的路由模式
    2016-12-30

回答者

丁涛
it技术咨询顾问fit2cloud
擅长领域: 云计算私有云主机

丁涛 最近回答过的问题

回答状态

  • 发布时间:2016-12-30
  • 关注会员:7 人
  • 回答浏览:7069
  • X社区推广