有两台power 740 机器,做的hacmp,版本是6.1。A 机装app B 机装oracle
其中在A机器上一直报错,但是B机器没有报错
A-bash-3.2# errpt
标识 时间戳记 T C 资源名 描述
65DE6DE3 0321000017 P S hdisk3 无法执行请求的操作
65DE6DE3 0321000017 P S hdisk3 无法执行请求的操作
65DE6DE3 0321000017 P S hdisk3 无法执行请求的操作
A-bash-3.2# lspv
hdisk0 00f835877a96e46f rootvg active
hdisk1 00f835878cfc96d1 rootvg active
hdisk2 00f835879b2f7d69 appvg active
hdisk3 00f835879ba761a8 datavg
Hdisk3是存储映射过来给B 机用的。A机器是没有挂载的。
查看HACMP 的定时任务,有一个是0 点的脚本
0 0 * * */usr/es/sbin/cluster/utilities/clcycle 1>/dev/null 2>/dev/null # HACMPfor AIX Logfile rotation
想问下,这个问题时什么原因造成的,如何解决?
从你的描述来看,应该是A机上面某个程序或者进程调用到hdisk3这块磁盘了,但是这块磁盘正常应该是属于B机的,所以它报了这个错。
按照正常来讲,这个错并不会导致应用和数据库有任何使用问题,你应当是能够正常使用机器的。
不过对于有强迫症的工程师或者客户来讲,包括我,这是不能忍受的。
第一,排查A机中所有程序和进程,查看有无对hdisk3的任何调用,其中最有可能的是看看备份的软件或者策略。
第二,将B机的数据库切换到A机,让hdisk3激活,看看是否报错消除。
第三,彻底把A机系统重装,重新配置双机和应用软件。
定时任务没问题,修建日志的。
1. 先确认你的资源组vg采用了什么方式,是普通的 还是fast takeover
2. 然后再看hdisk3的属性,如果是fast takeover的建议改成no_reserve
收起首先要确认,你加到hacmp里面的vg的属性。