一点疑问

客户报修,P630在远程PING不通了。我在客户到后到达现场。看到的情况是P630正在重启中。先说明下机房环境,两台P630加一台盘阵,用HACMP做双机热备,宕机的是备机。在主机这边看到的是一个重复的IP地址的报错,在IP冲突报错后出现若干NMI的报错,直到宕机为止。先抛开IP冲突不说,因为不知道是哪个环节的错误导致IP冲突。备机起来以后看了看报错,也没说什么实质性的东西。在主机这边看常用指标也是比较正常的,本来悬着的心已经基本放下了,估计是IP冲突导致宕机的。就在这时候,用lssrc -g cluster命令查看备机HA状态,发现不正常没有HA启动的信息。这就很奇怪了,于是more /etc/hosts 查看,里面正常。尝试手工启动HA,smitty clstat,报错:找不到另外的一个节点。网络没有问题,因为是从主机TELNET到备机上的,IP地址也没问题,但是就只报告节点找不到。这是一个很奇怪的问题,大家讨论讨论。应该可以排除硬件故障的可能,从两台机器的errpt 和MAIL里面都没有发现有关硬件的报错。我也会根据故障处理的结果给与追踪报道。
参与9

9同行回答

skyzqqskyzqq系统运维工程师中国联通河南省分公司
需要重启HA,最好先同步一下显示全部
需要重启HA,最好先同步一下收起
电信运营商 · 2009-08-12
浏览2609
爱如潮水爱如潮水研发工程师四川农信
关注楼主的最新故障追踪报道:handshake显示全部
关注楼主的最新故障追踪报道:handshake收起
金融其它 · 2009-08-12
浏览2613
fly0176fly0176IT顾问新明星
前置机,不知道能不能重启。显示全部
前置机,不知道能不能重启。收起
系统集成 · 2009-08-09
浏览2698
myciciymyciciyIT顾问某金融科技公司
业务允许的情况下 重新启动两台机器就没事了显示全部
业务允许的情况下 重新启动两台机器就没事了收起
银行 · 2009-08-09
浏览2651
fly0176fly0176IT顾问新明星
那当时是如何解决的?显示全部
那当时是如何解决的?收起
系统集成 · 2009-08-09
浏览2636
skyzqqskyzqq系统运维工程师中国联通河南省分公司
我遇到一次是主机负载太高。另外一台试图接管造成两台主机抢资源,故障现象和这个很相像显示全部
我遇到一次是主机负载太高。另外一台试图接管造成两台主机抢资源,故障现象和这个很相像收起
电信运营商 · 2009-08-09
浏览2664
myciciymyciciyIT顾问某金融科技公司
可能因为IO负载过大,导致心跳异常,从而发生脑裂 导致资源争抢 ip冲突 然后宕机显示全部
可能因为IO负载过大,导致心跳异常,从而发生脑裂 导致资源争抢 ip冲突 然后宕机收起
银行 · 2009-08-09
浏览2673
fly0176fly0176IT顾问新明星
应该不是HA的配置问题,因为原来的HA是可以正常工作的,通过检查主备机的history 没有发现有更改痕迹。显示全部
应该不是HA的配置问题,因为原来的HA是可以正常工作的,通过检查主备机的history 没有发现有更改痕迹。收起
系统集成 · 2009-08-09
浏览2635
skyzqqskyzqq系统运维工程师中国联通河南省分公司
HA 地址怎么配的? 别名?替换?显示全部
HA 地址怎么配的? 别名?替换?收起
电信运营商 · 2009-08-09
浏览2592

提问者

fly0176
IT顾问新明星
擅长领域: 服务器系统管理存储

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2009-08-09
  • 关注会员:0 人
  • 问题浏览:7412
  • 最近回答:2009-08-12
  • X社区推广