互联网服务PowerHAPowerHA故障

如何快速定位PowerHA的故障原因?

如果在遇到PowerHA的问题之后,如何快速定位PowerHA的故障原因?

参与7

1同行回答

mxin辛旻mxin辛旻  资深工程师 , 上海宝信软件股份有限公司
为了更好的维护好PowerHA,平时的检查和处理是必不可少的,下面提供的检查和处理方法除非特别说明,均是不用停机、停止应用即可进行,不影响用户使用。不过具体实施前需要仔细检查状态,再予以实施。clverify检查    这个检查可以对包括LVM的绝大多数PowerHA的配置同步...显示全部

为了更好的维护好PowerHA,平时的检查和处理是必不可少的,下面提供的检查和处理方法除非特别说明,均是不用停机、停止应用即可进行,不影响用户使用。不过具体实施前需要仔细检查状态,再予以实施。

clverify检查

    这个检查可以对包括LVM的绝大多数PowerHA的配置同步状态,是PowerHA检查是否同步的主要方式。

cldump检查:

cldump的监测为将当前PowerHA的状态快照,确认显示为UP,STABLE。

clstat检查

clstat可以实时监控PowerHA的状态,及时确认显示为UP,STABLE

/etc/hosts环境检查

  正常情况下,2台互备的/etc/hosts应该是一致的,当然如果是主备机方式,可能备机会多些IP地址和主机名。通过对比2个文件的不同,可以确认是否存在问题。

用户检查

    正常情况下,2台互备的HA使用到的用户情况应该是一致的,当然如果是主备机方式,可能备机会多些用户。通过对比2节点的不同,可以确认是否存在问题。

tty 心跳检查

    由于心跳在PowerHA启动后一直由PowerHA在用,所以需要[url=#_强制停掉HACMP:]强制停掉PowerHA[/url]进行检查。


errpt的检查

    虽然有了以上许多检查,但我们最常看的errpt不要忽略,因为有些报错,需要大家引起注意,由于crontab里PowerHA会增加这样一行:

0 0 * * * /usr/es/sbin/cluster/utilities/clcycle 1>/dev/null 2>/dev/null # PowerHA for AIX Logfile rotation

   即实际上每天零点,系统会自动执行PowerHA的检查,如果发现问题,会在errpt看到。

  通过快速进行上述检查,自然能发现问题。

特别细的步骤,请参加《PowerHA完全手册》的维护篇。

收起
IT咨询服务 · 2015-10-30
浏览1768

提问者

wenjing
软件架构设计师高德地图
擅长领域: 大数据商业智能数据库

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-10-29
  • 关注会员:4 人
  • 问题浏览:4790
  • 最近回答:2015-10-30
  • X社区推广