互联网服务

RAC 哪个节点先启动HA就哪个节点实例能启动的问题

前面都一直好好的,RAC的两个节点都一切运行正常,可是我出差了一个多月回来检查数据库的时候发现只有一个节点的实例在运行,另一个节点怎么都启动不了,后来将服务器重启了也不行,后来无意中发现哪个节点先启动HA,那个节点就能正常启动所有实例,而后启动的一个实例都启动不了,真怪了。问了下可能操作这台服务器的人,都说没做过什么配置,自我走后就没人动过数据库。
     看了下rac日志,最近都一直报一个错误

2010-10-11 12:17:15.846: [  OCROSD][1]utopen:7:failed to open OCR file/disk /dev/rOCRFile /dev/rOCRFileMirror, errno=6, os err string=No such device or address
2010-10-11 12:17:15.846: [  OCRRAW][1]proprinit: Could not open raw device
2010-10-11 12:17:15.846: [ default][1]a_init:7!: Backend init unsuccessful : [26]
2010-10-11 12:17:15.846: [ CSSCLNT][1]clsssinit: Unable to access OCR device in OCR init.


就是说不能访问OCR,有人碰到过这种奇怪问题么,要怎么解决呀?都没改过任何东西,真奇怪了。

-------------------------------------------------------------------------------------------------------
      目前已经解决了,最终原因是因为有人拔了交换机上连接服务器心跳线的口子,也就是心跳线不通了。因为机房一直管理很严,不会有人随便能进来,也没想会有人把心跳线给拔了。不过通过这个事还是学到了很多东西,谢谢大家了。
参与49

49 同行回答

allanwang allanwang ADMIN IBM
恭喜!终于解决了。显示全部
恭喜!终于解决了。 收起
IT分销/经销 · 2010-10-13
浏览446
风影子 风影子 数据库管理员 深圳
reserve_policy=no_reserve这个不要该,本来就要这样的另外,你说的心跳口是指?HACMP的么?myguangzhou 发表于 2010-10-13 15:45 做RAC的心跳线,也就是priv ip,节点间内部通信用的。都接在交换机上,但交换机上有个口的网线不知道给谁给拔出来了。...显示全部
reserve_policy=no_reserve这个不要该,本来就要这样的
另外,你说的心跳口是指?HACMP的么?
myguangzhou 发表于 2010-10-13 15:45


做RAC的心跳线,也就是priv ip,节点间内部通信用的。都接在交换机上,但交换机上有个口的网线不知道给谁给拔出来了。 收起
互联网服务 · 2010-10-13
浏览530
myguangzhou myguangzhou 技术经理 Uniwise
reserve_policy=no_reserve这个不要该,本来就要这样的另外,你说的心跳口是指?HACMP的么?显示全部
reserve_policy=no_reserve这个不要该,本来就要这样的
另外,你说的心跳口是指?HACMP的么? 收起
互联网服务 · 2010-10-13
浏览488
风影子 风影子 数据库管理员 深圳
问题已经解决了,犯了个超低级的错误,原来是心跳心的一个口被人拔了,机房一直管理很严的,我就出差了一个多月,没去想有人动了心跳线。把心跳线接上,重启了一次服务器,什么都好了,但是我把那些盘的属性都设置成了reserve_policy=no_reserve,不知道要不要再改回原来的reserve_policy=...显示全部
问题已经解决了,犯了个超低级的错误,原来是心跳心的一个口被人拔了,机房一直管理很严的,我就出差了一个多月,没去想有人动了心跳线。把心跳线接上,重启了一次服务器,什么都好了,但是我把那些盘的属性都设置成了reserve_policy=no_reserve,不知道要不要再改回原来的reserve_policy=single_path,有人能给我准确的答案么? 收起
互联网服务 · 2010-10-13
浏览485
myguangzhou myguangzhou 技术经理 Uniwise
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。allanwang 发表于 2010-10-13 15:09 这不是存储的镜像Oracle建议ocr\votedisk\controlfile等文件要进行多工,即多个副本;当然如果这些文件都放在同一个LUN上那多工就没多大的意义了...显示全部
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。
allanwang 发表于 2010-10-13 15:09

这不是存储的镜像
Oracle建议ocr\votedisk\controlfile等文件要进行多工,即多个副本;当然如果这些文件都放在同一个LUN上那多工就没多大的意义了 收起
互联网服务 · 2010-10-13
浏览475
myguangzhou myguangzhou 技术经理 Uniwise
大概看了下你的LOGWARNING: clssnmLocalJoinEvent: takeover aborted due to ALIVE node on DiskWARNING: clssnmDiskPMT: voting device hang at 50 0.000000atal, termination in 99095 ms, disk (1//dev/rVOTFile2)2010-10-13 12:45:34.257: [  OCROSD][1]u...显示全部
大概看了下你的LOG
WARNING: clssnmLocalJoinEvent: takeover aborted due to ALIVE node on Disk


WARNING: clssnmDiskPMT: voting device hang at 50 0.000000atal, termination in 99095 ms, disk (1//dev/rVOTFile2)


2010-10-13 12:45:34.257: [  OCROSD][1]utopen:7:failed to open OCR file/disk /dev/rOCRFile /dev/rOCRFileMirror, errno=6, os err string=No such device or address
2010-10-13 12:45:34.257: [  OCRRAW][1]proprinit: Could not open raw device
2010-10-13 12:45:34.257: [ default][1]a_init:7!: Backend init unsuccessful : [26]
2010-10-13 12:45:34.257: [ CSSCLNT][1]clsssinit: Unable to access OCR device in OCR init.

还是ocr 和vote disk的问题
检查两边的权限有什么不一致,还有系统时间 收起
互联网服务 · 2010-10-13
浏览483
allanwang allanwang ADMIN IBM
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。显示全部
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。 收起
IT分销/经销 · 2010-10-13
浏览500
myguangzhou myguangzhou 技术经理 Uniwise
reserve_policy是在PV层面作的;ocr、votedisk都可以做MIRROR,其实也就是类似控制文件的多个副本一样,每个副本都一致,以防止单点故障显示全部
reserve_policy是在PV层面作的;
ocr、votedisk都可以做MIRROR,其实也就是类似控制文件的多个副本一样,每个副本都一致,以防止单点故障 收起
互联网服务 · 2010-10-13
浏览476
allanwang allanwang ADMIN IBM
不是手打的哦,是我复制的,到底是哪个盘要执行chdev -l hdisk4 -a reserve_policy=no_reserve 啊,我还没太弄懂。你的意思是说要知道祼设备是建在哪个盘下就对哪个盘执行么? ...风影子 发表于 2010-10-13 14:52 正确!只是我没有见过裸设备用这种命名方式的,所以一下子没理解。有...显示全部
不是手打的哦,是我复制的,到底是哪个盘要执行chdev -l hdisk4 -a reserve_policy=no_reserve 啊,我还没太弄懂。你的意思是说要知道祼设备是建在哪个盘下就对哪个盘执行么? ...
风影子 发表于 2010-10-13 14:52

正确!只是我没有见过裸设备用这种命名方式的,所以一下子没理解。有两个major number 相同的设备,对前面没有”r“的设备进行设置就对了。 收起
IT分销/经销 · 2010-10-13
浏览467
myguangzhou myguangzhou 技术经理 Uniwise
Disk method这个要怎么定义,会不会是这个没定义引起的?风影子 发表于 2010-10-13 13:56 第三方的阵列才需要,比如EMC HDS HP等,但是IBM的不需要了显示全部
Disk method这个要怎么定义,会不会是这个没定义引起的?
风影子 发表于 2010-10-13 13:56

第三方的阵列才需要,比如EMC HDS HP等,但是IBM的不需要了 收起
互联网服务 · 2010-10-13
浏览509

提问者

风影子
风影子 0 3 4
数据库管理员 深圳
擅长领域: 服务器LinuxUnix
评论1223

问题状态

  • 发布时间:2010-10-12
  • 关注会员:0 人
  • 问题浏览:19570
  • 最近回答:2010-10-25
  • X社区推广