Oracle RAC安装失败难道跟服务器硬件有关?(已结贴)

虽然我这个案例跟AIX无关,但考虑到专家坐诊人气比较足,因此还是把它放在这里....

这几天帮朋友做一个Windows2003/2008+Oracle10gr2 RAC的实施项目,环境本不复杂,但他们公司的工程师折腾了两天,都是一蓝屏告终!于是朋友找到我....
在WIN下面安装RAC我倒是第一次作,因此在vmware+openfiler环境下做了测试(3264bit都做过了),也算挺顺利.....

可是到客户现场却发现和前一位工程师一样的问题:蓝屏!

环境还是比较简单的
1.EMC CX4-120
2.DELL R910 SERVER
3.WIN2008 SP2/2003R2 SP2
4.ORACLE 10G R2 10.2.04 CRS
5.100M LAN

我的安装步骤
1.同步时间
2.2节点的用户名及秘密一致,net use能登录到对方共享文件夹,权限没问题
3.防火墙关闭
4.Automount enable(2003默认是disable,而2008则是enable)
5.公网私网网卡命名为publicprivate,两边对应一致;把公网网卡排在私网的前面
6.公网和私网在不同的网段,并且IP及对应的名字在LAN上都是唯一的
7.用HOSTS来解释IP及域名,privvip都可以PING通
8.127.0.0.1这行只有localhost,无其他名字
9.在一个节点上创建逻辑分区CRSVOTE,不格式化;然后在另外节点scan磁盘,把系统自己加的盘符去掉
10.按照metalink里的GUIDE,修改注册表,把DHCP禁用
HKEY_LOCAL_MACHINESystemCurrentControlSetServicesTcpipParameters
    Add the following registry value:
    Value Name: DisableDHCPMediaSense
    Data Type: REG_DWORD -Boolean
    Value: 1
    Restart the computer.

11.把Distributed Transaction Coordinator服务关闭,并改为手动
12.笔记本远程连接到节点
mstsc -v:servername /F /console (2003)
mstsc -v:servername /F /admin    (2008)
13.cluvfy除了VIP外,其他都通过;而这个VIP的错误是可以忽略的


结果很杯具
1.在2008上安装CRS时,检查不通过,metalink里找了下,是一个BUG,下载补丁,并照着做了
setup.exe New_Driver_Loc="D:driver_stage7320726" ,通过了;但在安装到30%多,要启动CRS相关服务的时候,安装节点就蓝屏自动REBOOT,而对端节点却是好好的!

2.于是分别在metalink和google上搜索了一下,发现也有人碰到蓝屏现象,但那都是安装完CRS之后在没有识别到存储之前就尝试启动CRS而导致蓝屏重启的,貌似用打上BUG opmd就好了;跟我的故障没有类似的地方;

3.反复尝试故障依旧;考虑到2008比较新,而10G确是05年的产品了,这样搭配不是很合理,于是建议客户换成2003的,这样用起来也稳定些;客户答应了换系统,可是我自己却无法解释为什么我在虚拟环境下可以完成2008 CRS的安装,而客户那里却不行!

4.把系统换成2003R2SP2,检查先决条件时还是无法找到ocfs.sys.w2k864!狗血,metalink里不是说2008才有这情况吗?于是按照2008的方式setup.exe New_Driver_Loc="D:driver_stage7320726" ,真晕,居然还提示找不到这个文件,我反复检查目录是没错的,而在2008上是执行成功了的啊;不解。

5.于是想,10.2.04 CRS是否新了点,存在BUG?不妨先用10.2.01来安装?于是又从oracle网站下载了10.2.01CRS;安装时再没出现ocfs.sys.w2k864找不到了;但是安装到58%的时候,要创建orafenceservice时就蓝屏重启,但和2008不一样;2008重启很快,而2003却要往里面写core(or dump?)文件,N久都没完成;于是强制关机重新启动;反复尝试几次故障一样,都是在创建orafenceservice时就蓝屏

6.怀疑跟存储有关?找到EMC的文档,把failover mode等都设对了,蓝屏!于是更换powerpath版本,蓝屏!把powerpath删除,用一张HBA卡来连接,还是蓝屏!于是用笔记本安装openfiler来模拟存储,还是蓝屏!

7.在以上重新安装CRS时,我都把CRS文件夹删除,在注册表里删除相关服务,CRSVOTE逻辑分区删除重新再建的;故障依旧;难道删除的不干净?应该不会,如果删除不干净,安装时会报XX服务已经存在的警告;好吧,干脆把OS干掉,重新按装,并GHOST;每失败一次就重新恢复。。。尝试了2次,还是他妈的蓝屏

8.尝试单节点安装CRS,还是蓝屏

9.怀疑私网100M会出问题,于是把网线直接相连手动指定1000M FULL,还是蓝屏啊!..

10.认真看过metalink里的GUIDE了,都照做了;其实没有太多要 设定的,比UNIX/LINUX下安装RAC要简单些;也参照网上共享的文档,其实步骤就那几个,人家都可以完成而我却是蓝屏;这真让我纳闷

11.在系统日志里看到“等待oracle object service服务的连接时间超时(30000毫秒)”“由于下列错误,Orafenceservice服务启动失败”等错误;在inventorylog里详细看了下安装日志,发现只有信息而无警告或者错误....无法获取更多的信息来排查

12.回到家里,用笔记本安装2003r2sp2(用的和客户现场的同一个ISO镜像文件),openfiler模拟阵列,单节点按装CRS,都很顺利,虽然有点慢...

我在想,
为什么别人都能在2003上安装10GR2 CRS,即使有点小错误,最后却都比较容易地解决掉了;而我却以蓝屏失败?
难道我步骤有错?可是在虚拟环境下却完全没问题啊?!
难道ORACLE CRS对服务器硬件还有要求?这个倒是从没 听说过的啊,只是看过OS对硬件有要求的.....并且DELL R910是主流的PC SERVER啊.....

在WIN下面安装过RAC的童鞋都来讨论一下,列出你们的环境,存储及服务器、OS、CRS版本......
参与42

41同行回答

GloryLewGloryLew项目经理河北东软软件有限公司
有没有别的同型号的PC SERVER啊,安装下试试显示全部
有没有别的同型号的PC SERVER啊,安装下试试收起
系统集成 · 2011-06-18
浏览791
myguangzhoumyguangzhou技术经理Uniwise
后来人家ERP的人说,还是用冷备方式吧,连HA都不用于是我就照做了不过也颇费了点时间ORA在WIN_X64下问题也不少,即使装上去了,建库也失败,要把PATCH打到最新才行显示全部
后来人家ERP的人说,还是用冷备方式吧,连HA都不用
于是我就照做了
不过也颇费了点时间
ORA在WIN_X64下问题也不少,即使装上去了,建库也失败,要把PATCH打到最新才行收起
互联网服务 · 2011-06-18
浏览795
wjlcnwjlcn数据库管理员none
LZ 现在解决了没?显示全部
LZ 现在解决了没?收起
互联网服务 · 2011-06-18
浏览822
yangtu8yangtu8技术经理启明动力
系统 软件的问题显示全部
系统 软件的问题收起
IT分销/经销 · 2011-06-10
浏览778
mophismophis软件开发工程师杭州
Win Server下安装RAC,真是伤不起!显示全部
Win Server下安装RAC,真是伤不起!收起
互联网服务 · 2011-06-09
浏览740
dpkgdpkg软件开发工程师untitled
没在WINDOWS上装过RAC,帮楼主顶顶显示全部
没在WINDOWS上装过RAC,帮楼主顶顶收起
互联网服务 · 2011-06-09
浏览790
myguangzhoumyguangzhou技术经理Uniwise
最杯具的事情莫过于此我把帖子发到ITPUB,居然没有一个人回帖伤不起啊显示全部
最杯具的事情莫过于此
我把帖子发到ITPUB,居然没有一个人回帖
伤不起啊收起
互联网服务 · 2011-06-09
浏览696
feidaodaofeidaodao系统运维工程师GA
既然没买,那OS换成LINUX吧。显示全部
既然没买,那OS换成LINUX吧。收起
金融其它 · 2011-06-09
浏览772
myguangzhoumyguangzhou技术经理Uniwise
问题是人家没买ORA显示全部
问题是人家没买ORA收起
互联网服务 · 2011-06-09
浏览773
myciciymyciciyIT顾问某金融科技公司
oracle不是啥都想自己做吗 自己开发一个win2代不久解决了 不然以oracle性格 肯定说 不都用我的东西  蓝屏很正常显示全部
oracle不是啥都想自己做吗 自己开发一个win2代不久解决了 不然以oracle性格 肯定说 不都用我的东西  蓝屏很正常收起
银行 · 2011-06-09
浏览776

提问者

myguangzhou
技术经理Uniwise
擅长领域: 服务器AIXUnix

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-06-04
  • 关注会员:1 人
  • 问题浏览:28743
  • 最近回答:2012-01-03
  • X社区推广