Oracle RAC安装失败难道跟服务器硬件有关?(已结贴)

虽然我这个案例跟AIX无关,但考虑到专家坐诊人气比较足,因此还是把它放在这里....

这几天帮朋友做一个Windows2003/2008+Oracle10gr2 RAC的实施项目,环境本不复杂,但他们公司的工程师折腾了两天,都是一蓝屏告终!于是朋友找到我....
在WIN下面安装RAC我倒是第一次作,因此在vmware+openfiler环境下做了测试(3264bit都做过了),也算挺顺利.....

可是到客户现场却发现和前一位工程师一样的问题:蓝屏!

环境还是比较简单的
1.EMC CX4-120
2.DELL R910 SERVER
3.WIN2008 SP2/2003R2 SP2
4.ORACLE 10G R2 10.2.04 CRS
5.100M LAN

我的安装步骤
1.同步时间
2.2节点的用户名及秘密一致,net use能登录到对方共享文件夹,权限没问题
3.防火墙关闭
4.Automount enable(2003默认是disable,而2008则是enable)
5.公网私网网卡命名为publicprivate,两边对应一致;把公网网卡排在私网的前面
6.公网和私网在不同的网段,并且IP及对应的名字在LAN上都是唯一的
7.用HOSTS来解释IP及域名,privvip都可以PING通
8.127.0.0.1这行只有localhost,无其他名字
9.在一个节点上创建逻辑分区CRSVOTE,不格式化;然后在另外节点scan磁盘,把系统自己加的盘符去掉
10.按照metalink里的GUIDE,修改注册表,把DHCP禁用
HKEY_LOCAL_MACHINESystemCurrentControlSetServicesTcpipParameters
    Add the following registry value:
    Value Name: DisableDHCPMediaSense
    Data Type: REG_DWORD -Boolean
    Value: 1
    Restart the computer.

11.把Distributed Transaction Coordinator服务关闭,并改为手动
12.笔记本远程连接到节点
mstsc -v:servername /F /console (2003)
mstsc -v:servername /F /admin    (2008)
13.cluvfy除了VIP外,其他都通过;而这个VIP的错误是可以忽略的


结果很杯具
1.在2008上安装CRS时,检查不通过,metalink里找了下,是一个BUG,下载补丁,并照着做了
setup.exe New_Driver_Loc="D:driver_stage7320726" ,通过了;但在安装到30%多,要启动CRS相关服务的时候,安装节点就蓝屏自动REBOOT,而对端节点却是好好的!

2.于是分别在metalink和google上搜索了一下,发现也有人碰到蓝屏现象,但那都是安装完CRS之后在没有识别到存储之前就尝试启动CRS而导致蓝屏重启的,貌似用打上BUG opmd就好了;跟我的故障没有类似的地方;

3.反复尝试故障依旧;考虑到2008比较新,而10G确是05年的产品了,这样搭配不是很合理,于是建议客户换成2003的,这样用起来也稳定些;客户答应了换系统,可是我自己却无法解释为什么我在虚拟环境下可以完成2008 CRS的安装,而客户那里却不行!

4.把系统换成2003R2SP2,检查先决条件时还是无法找到ocfs.sys.w2k864!狗血,metalink里不是说2008才有这情况吗?于是按照2008的方式setup.exe New_Driver_Loc="D:driver_stage7320726" ,真晕,居然还提示找不到这个文件,我反复检查目录是没错的,而在2008上是执行成功了的啊;不解。

5.于是想,10.2.04 CRS是否新了点,存在BUG?不妨先用10.2.01来安装?于是又从oracle网站下载了10.2.01CRS;安装时再没出现ocfs.sys.w2k864找不到了;但是安装到58%的时候,要创建orafenceservice时就蓝屏重启,但和2008不一样;2008重启很快,而2003却要往里面写core(or dump?)文件,N久都没完成;于是强制关机重新启动;反复尝试几次故障一样,都是在创建orafenceservice时就蓝屏

6.怀疑跟存储有关?找到EMC的文档,把failover mode等都设对了,蓝屏!于是更换powerpath版本,蓝屏!把powerpath删除,用一张HBA卡来连接,还是蓝屏!于是用笔记本安装openfiler来模拟存储,还是蓝屏!

7.在以上重新安装CRS时,我都把CRS文件夹删除,在注册表里删除相关服务,CRSVOTE逻辑分区删除重新再建的;故障依旧;难道删除的不干净?应该不会,如果删除不干净,安装时会报XX服务已经存在的警告;好吧,干脆把OS干掉,重新按装,并GHOST;每失败一次就重新恢复。。。尝试了2次,还是他妈的蓝屏

8.尝试单节点安装CRS,还是蓝屏

9.怀疑私网100M会出问题,于是把网线直接相连手动指定1000M FULL,还是蓝屏啊!..

10.认真看过metalink里的GUIDE了,都照做了;其实没有太多要 设定的,比UNIX/LINUX下安装RAC要简单些;也参照网上共享的文档,其实步骤就那几个,人家都可以完成而我却是蓝屏;这真让我纳闷

11.在系统日志里看到“等待oracle object service服务的连接时间超时(30000毫秒)”“由于下列错误,Orafenceservice服务启动失败”等错误;在inventorylog里详细看了下安装日志,发现只有信息而无警告或者错误....无法获取更多的信息来排查

12.回到家里,用笔记本安装2003r2sp2(用的和客户现场的同一个ISO镜像文件),openfiler模拟阵列,单节点按装CRS,都很顺利,虽然有点慢...

我在想,
为什么别人都能在2003上安装10GR2 CRS,即使有点小错误,最后却都比较容易地解决掉了;而我却以蓝屏失败?
难道我步骤有错?可是在虚拟环境下却完全没问题啊?!
难道ORACLE CRS对服务器硬件还有要求?这个倒是从没 听说过的啊,只是看过OS对硬件有要求的.....并且DELL R910是主流的PC SERVER啊.....

在WIN下面安装过RAC的童鞋都来讨论一下,列出你们的环境,存储及服务器、OS、CRS版本......
参与42

41同行回答

myciciymyciciyIT顾问某金融科技公司
没发给你自己强制结贴显示全部
没发给你自己强制结贴收起
银行 · 2012-01-03
浏览2860
woalulwoalul工程师南京成瑞
听说在windows上装rac,是经常要蓝屏的,必须要打个补丁,只能这样干,还是只能开一个机器打,然后在用样的方法去打另一个补丁显示全部
听说在windows上装rac,是经常要蓝屏的,必须要打个补丁,只能这样干,还是只能开一个机器打,然后在用样的方法去打另一个补丁收起
2012-01-03
浏览2793
myguangzhoumyguangzhou技术经理Uniwise
我们明年就有一个项目,服务器是两台IBM x3850服务器,要在上面装RAC数据库,不知道会不会出这样的问题。 ...风影子 发表于 2011-12-19 17:05 非WINDOWS就没问题的搜索了一下,ITPUB上好几个人碰到这样的问题...显示全部
我们明年就有一个项目,服务器是两台IBM x3850服务器,要在上面装RAC数据库,不知道会不会出这样的问题。 ...
风影子 发表于 2011-12-19 17:05



非WINDOWS就没问题的

搜索了一下,ITPUB上好几个人碰到这样的问题收起
互联网服务 · 2011-12-19
浏览2832
风影子风影子数据库管理员深圳
问题找到了结贴吧原因是ORACLE_WIN不支持高端多核的PC SERVER,有人在32核上安装蓝屏,降到24核就OK了 ...myguangzhou 发表于 2011-12-19 16:55 我们明年就有一个项目,服务器是两台IBM x3850服务器,要在上面装RAC数据库,不知道会不会出这样的问题。...显示全部
问题找到了
结贴吧

原因是ORACLE_WIN不支持高端多核的PC SERVER,有人在32核上安装蓝屏,降到24核就OK了

...
myguangzhou 发表于 2011-12-19 16:55


我们明年就有一个项目,服务器是两台IBM x3850服务器,要在上面装RAC数据库,不知道会不会出这样的问题。收起
互联网服务 · 2011-12-19
浏览2985
myguangzhoumyguangzhou技术经理Uniwise
问题找到了结贴吧原因是ORACLE_WIN不支持高端多核的PC SERVER,有人在32核上安装蓝屏,降到24核就OK了还有更搞笑的是,华赛有人在IBM X系列的高端PC SERVER(类似小型机那样可以加柜子扩容的)上安装也出现蓝屏,后来一分为2,把一台分成2台来装,结果神奇般地OK了。...显示全部
问题找到了
结贴吧

原因是ORACLE_WIN不支持高端多核的PC SERVER,有人在32核上安装蓝屏,降到24核就OK了

还有更搞笑的是,华赛有人在IBM X系列的高端PC SERVER(类似小型机那样可以加柜子扩容的)上安装也出现蓝屏,后来一分为2,把一台分成2台来装,结果神奇般地OK了。收起
互联网服务 · 2011-12-19
浏览2897
zc_123zc_123系统集成商/VAR 顾问南昌明德
路过 顶一下吧显示全部
路过 顶一下吧收起
IT分销/经销 · 2011-07-10
浏览2812
myguangzhoumyguangzhou技术经理Uniwise
据说,Oracle_win在32核或以上的高端服务器上安装会出现蓝屏的问题显示全部
据说,Oracle_win在32核或以上的高端服务器上安装会出现蓝屏的问题收起
互联网服务 · 2011-07-06
浏览2835
cqfantangcqfantang系统工程师华际信息系统有限公司
路过 顶一下吧显示全部
路过 顶一下吧收起
互联网服务 · 2011-07-06
浏览2785
szhangkangszhangkang项目经理aaa
windows下安装oracle 真是不容易呀显示全部
windows下安装oracle 真是不容易呀收起
互联网服务 · 2011-06-20
浏览2797
0_00_0数据库管理员ciso
oracle 就别支持win了 一蓝屏 肯定拿win说事显示全部
oracle 就别支持win了 一蓝屏 肯定拿win说事收起
政府机关 · 2011-06-20
浏览2928

提问者

myguangzhou
技术经理Uniwise
擅长领域: 服务器AIXUnix

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-06-04
  • 关注会员:1 人
  • 问题浏览:28470
  • 最近回答:2012-01-03
  • X社区推广