互联网服务

RAC 哪个节点先启动HA就哪个节点实例能启动的问题

前面都一直好好的,RAC的两个节点都一切运行正常,可是我出差了一个多月回来检查数据库的时候发现只有一个节点的实例在运行,另一个节点怎么都启动不了,后来将服务器重启了也不行,后来无意中发现哪个节点先启动HA,那个节点就能正常启动所有实例,而后启动的一个实例都启动不了,真怪了。问了下可能操作这台服务器的人,都说没做过什么配置,自我走后就没人动过数据库。
     看了下rac日志,最近都一直报一个错误

2010-10-11 12:17:15.846: [  OCROSD][1]utopen:7:failed to open OCR file/disk /dev/rOCRFile /dev/rOCRFileMirror, errno=6, os err string=No such device or address
2010-10-11 12:17:15.846: [  OCRRAW][1]proprinit: Could not open raw device
2010-10-11 12:17:15.846: [ default][1]a_init:7!: Backend init unsuccessful : [26]
2010-10-11 12:17:15.846: [ CSSCLNT][1]clsssinit: Unable to access OCR device in OCR init.


就是说不能访问OCR,有人碰到过这种奇怪问题么,要怎么解决呀?都没改过任何东西,真奇怪了。

-------------------------------------------------------------------------------------------------------
      目前已经解决了,最终原因是因为有人拔了交换机上连接服务器心跳线的口子,也就是心跳线不通了。因为机房一直管理很严,不会有人随便能进来,也没想会有人把心跳线给拔了。不过通过这个事还是学到了很多东西,谢谢大家了。
参与49

49 同行回答

wangwenfly wangwenfly 系统分析师 ww
如果我回答对了,记得给我钱显示全部
如果我回答对了,记得给我钱 收起
IT分销/经销 · 2010-10-25
浏览1475
allanwang allanwang ADMIN IBM
这不是存储的镜像Oracle建议ocr\votedisk\controlfile等文件要进行多工,即多个副本;当然如果这些文件都放在同一个LUN上那多工就没多大的意义了myguangzhou 发表于 2010-10-13 15:34 原来是这样的,受教了。...显示全部
这不是存储的镜像
Oracle建议ocr\votedisk\controlfile等文件要进行多工,即多个副本;当然如果这些文件都放在同一个LUN上那多工就没多大的意义了
myguangzhou 发表于 2010-10-13 15:34

原来是这样的,受教了。 收起
IT分销/经销 · 2010-10-13
浏览1463
allanwang allanwang ADMIN IBM
恭喜!终于解决了。显示全部
恭喜!终于解决了。 收起
IT分销/经销 · 2010-10-13
浏览445
allanwang allanwang ADMIN IBM
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。显示全部
但是作为LUN,其本身就有备份了,还需要这么做吗?我对storage不太明白,所以有此问。 收起
IT分销/经销 · 2010-10-13
浏览499
allanwang allanwang ADMIN IBM
不是手打的哦,是我复制的,到底是哪个盘要执行chdev -l hdisk4 -a reserve_policy=no_reserve 啊,我还没太弄懂。你的意思是说要知道祼设备是建在哪个盘下就对哪个盘执行么? ...风影子 发表于 2010-10-13 14:52 正确!只是我没有见过裸设备用这种命名方式的,所以一下子没理解。有...显示全部
不是手打的哦,是我复制的,到底是哪个盘要执行chdev -l hdisk4 -a reserve_policy=no_reserve 啊,我还没太弄懂。你的意思是说要知道祼设备是建在哪个盘下就对哪个盘执行么? ...
风影子 发表于 2010-10-13 14:52

正确!只是我没有见过裸设备用这种命名方式的,所以一下子没理解。有两个major number 相同的设备,对前面没有”r“的设备进行设置就对了。 收起
IT分销/经销 · 2010-10-13
浏览466
allanwang allanwang ADMIN IBM
对不起,我没仔细看你的帖子,其实我觉得OCRFile就是我说的hdiskN,改它就可以了。我没有做过raw的镜像,所以不太明白如何处理镜像盘的问题。显示全部
对不起,我没仔细看你的帖子,其实我觉得OCRFile就是我说的hdiskN,改它就可以了。我没有做过raw的镜像,所以不太明白如何处理镜像盘的问题。 收起
IT分销/经销 · 2010-10-13
浏览520
allanwang allanwang ADMIN IBM
concurrent的盘是不需要执行此操作的,我不知道这样做会产生什么影响,我个人觉得不必做,所谓做多错多就是这么解释吧。另外你的raw好像做了镜像,两个盘都得设置。显示全部
concurrent的盘是不需要执行此操作的,我不知道这样做会产生什么影响,我个人觉得不必做,所谓做多错多就是这么解释吧。
另外你的raw好像做了镜像,两个盘都得设置。 收起
IT分销/经销 · 2010-10-13
浏览504
allanwang allanwang ADMIN IBM
我明白了,我以前也犯过你同样的错误,$ ls -l /dev |grep "44,  1"你这个命令中的major number 是手打的吧? 用前一个命令结果的copy试试,这个问题曾经困扰了我好几天。显示全部
我明白了,我以前也犯过你同样的错误,
$ ls -l /dev |grep "44,  1"
你这个命令中的major number 是手打的吧? 用前一个命令结果的copy试试,这个问题曾经困扰了我好几天。 收起
IT分销/经销 · 2010-10-13
浏览510
allanwang allanwang ADMIN IBM
另外,现在不出问题,不代表以后不出问题,留下隐患是不好的,以后出问题的时候,你忘记了这件事,就需要花更多的精力去查,还不一定能否查出来。显示全部
另外,现在不出问题,不代表以后不出问题,留下隐患是不好的,以后出问题的时候,你忘记了这件事,就需要花更多的精力去查,还不一定能否查出来。 收起
IT分销/经销 · 2010-10-13
浏览516
allanwang allanwang ADMIN IBM
你要先查清楚盘和node的对应关系:# ls -l /dev |grep rOCRFile会显示一个类似的东西出来:crw-r----1 root oinstill 24, 8192 Aug 10 2010 /dev/rOCRFile注意: 24, 8192是major number# ls -l /dev |grep "24, 8192"找出有相同major number的hdiskN 和rhdiskN,他们是一组的,是...显示全部
你要先查清楚盘和node的对应关系:
# ls -l /dev |grep rOCRFile
会显示一个类似的东西出来:
crw-r----1 root oinstill 24, 8192 Aug 10 2010 /dev/rOCRFile
注意: 24, 8192是major number
# ls -l /dev |grep "24, 8192"
找出有相同major number的hdiskN 和rhdiskN,他们是一组的,是一个东西,你要改变的是hdiskN的属性:
# chdev -l hdiskN -a reserve_lock=no
或者
# chdev -l hdiskN -a reserve_policy=no_reserve 收起
IT分销/经销 · 2010-10-13
浏览547

提问者

风影子
风影子 0 3 4
数据库管理员 深圳
擅长领域: 服务器LinuxUnix
评论1223

问题状态

  • 发布时间:2010-10-12
  • 关注会员:0 人
  • 问题浏览:19566
  • 最近回答:2010-10-25
  • X社区推广