feidaodao
作者feidaodao·2012-02-24 01:30
系统运维工程师·GA

no参数没设定好造成RAC只能启动1个节点

字数 2039阅读 13252评论 1赞 1
下午按客户电话,RAC只能启动1个节点
env:aix610705,oracle11.2.0.3 rac

简要记录:
root@rac1#crsctl check cluster -all
CRS-4404: The following nodes did not reply within the allotted time:rac2

在log/alterrac1.log中报出rac2成功中断。。

当前crs&db只在节点1中启动,所有节点2资源全部在节点1来了。。。

看了半天日志,在log/crsd/crsd.log中发现:
[GIPCHALO][2314] gipchaLowerProcessNode: no valid interfaces found to node for 14767994 ms, node 1126edc90 { host 'rkxx2', haName '52e2-c408-7731-7b0f', s
rcLuid 2c966a2f-969d539f, dstLuid 00000000-00000000 numInf 0, contigSeq 0, lastAck 0, lastValidAck 0, sendSeq [1656 : 1656], createTime 13106004, sentRegister 1, localMonitor 0, f
lags 0x4 }

2012-02-23 16:59:57.566: [GIPCXCPT][2057] gipchaInternalResolve: failed to resolve ret gipcretKeyNotFound (36), host 'rac2', port '49c3-bc3e-9aa9-b8a0', hctx 11122fed0 [000000000
0000010] { gipchaContext : host 'rac2', name '02aa-856f-9ba0-5348', luid '2c966a2f-00000000', numNode 0, numInf 1, usrFlags 0x0, flags 0x1 }, ret gipcretKeyNotFound (36)
2012-02-23 16:59:57.566: [GIPCHGEN][2057] gipchaResolveF [gipcmodGipcResolve : gipcmodGipc.c : 804]: EXCEPTION[ ret gipcretKeyNotFound (36) ]  failed to resolve ctx 11122fed0 [000
0000000000010] { gipchaContext : host 'rac2', name '02aa-856f-9ba0-5348', luid '2c966a2f-00000000', numNode 0, numInf 1, usrFlags 0x0, flags 0x1 }, host 'rac2', port '49c3-bc3e-
9aa9-b8a0', flags 0x0

当时就想到是网络原因,但互相ssh都正常,网络也通呀。。。

上SUPPORT上找找

先找到:
https://support.oracle.com/CSP/main/article?cmd=show&type=NOT&doctype=PROBLEM&id=1392934.1
"crsctl check cluster -all" command gives CRS-4404, CRS-4405 errors [ID 1392934.1]

但这个的关键进程是gpnpd.bin,和我的情况不一样。。。


在support中找到类似错误
11.2.0.2 Grid Infrastructure Upgrade/Install on More Than One Node Cluster Fails With "gipchaLowerProcessNode: no valid interfaces found to node" in crsd.log [ID 1280234.1]

在一检查no -o udp_sendspace,发现值不对。。。
想来原来参数当时没加-p,只是当时生效。。。

更改,并重启确认,启动CRS&DB,一切正常。

--------------------------------------------------------------------------------------
指定接口的参数更改(对虚拟化接口的更改)
chdev -l en2 -a tcp_sendspace=65536
chdev -l en2 -a tcp_resvspace=65536

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论1 条评论

lixichaolixichao其它石河子大学
2015-12-25 00:50
在我这里的 linux 主机也出现了这种情况.
具体情况是,我这里搭建了一个 rac 的3节点数据库(第3哥节点是后面添加).
因为当时搭建好之后,就没有启动.今天我启动之后,发现启动之后 cluster服务没有起来,用 crsctl start crs 启动又报已经启动.所以先重启了一次机器,又起来了.但是用 CRSCTL CHECK CLUSTER -ALL 就发现了你这种情况.但是过了好几分钟,又正常了.
??????
Ctrl+Enter 发表

作者其他文章

X社区推广