为了更好的维护好PowerHA,平时的检查和处理是必不可少的,下面提供的检查和处理方法除非特别说明,均是不用停机、停止应用即可进行,不影响用户使用。不过具体实施前需要仔细检查状态,再予以实施。
clverify检查这个检查可以对包括LVM的绝大多数PowerHA的配置同步状态,是PowerHA检查是否同步的主要方式。
cldump检查:cldump的监测为将当前PowerHA的状态快照,确认显示为UP,STABLE。
clstat检查clstat可以实时监控PowerHA的状态,及时确认显示为UP,STABLE
/etc/hosts环境检查正常情况下,2台互备的/etc/hosts应该是一致的,当然如果是主备机方式,可能备机会多些IP地址和主机名。通过对比2个文件的不同,可以确认是否存在问题。
用户检查正常情况下,2台互备的HA使用到的用户情况应该是一致的,当然如果是主备机方式,可能备机会多些用户。通过对比2节点的不同,可以确认是否存在问题。
tty 心跳检查由于心跳在PowerHA启动后一直由PowerHA在用,所以需要[url=#_强制停掉HACMP:]强制停掉PowerHA[/url]进行检查。
虽然有了以上许多检查,但我们最常看的errpt不要忽略,因为有些报错,需要大家引起注意,由于crontab里PowerHA会增加这样一行:
0 0 * * * /usr/es/sbin/cluster/utilities/clcycle 1>/dev/null 2>/dev/null # PowerHA for AIX Logfile rotation
即实际上每天零点,系统会自动执行PowerHA的检查,如果发现问题,会在errpt看到。
通过快速进行上述检查,自然能发现问题。
特别细的步骤,请参加《PowerHA完全手册》的维护篇。
收起