互联网服务 Power服务器Oracleaix 5.3

oracle RAC 节点频繁重启

1.操作系统5.3.0.0
2.数据库版本:Release 10.2.0.4.0
3.两个节点。使用ASM管理。
4.网络配置
[rcy55a02][oracle][/home/oracle]#oifcfg getif            
en0  182.1.1.0  global  cluster_interconnect
en2  10.18.71.0  global  public
[rcy55a02][oracle][/home/oracle]# crsctl get css misscount
300

5.故障现象

[rcy55a01][root][/home/mxin/mon/log]#errpt   
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
A6DF45AA   0614022213 I O RMCdaemon      The daemon is started.
EC0BCCD4   0614022213 T H ent1           ETHERNET DOWN
2BFA76F6   0614022013 T S SYSPROC        SYSTEM SHUTDOWN BY USER
9DBCFDEE   0614022213 T O errdemon       ERROR LOGGING TURNED ON

---另一节点

[rcy55a02][oracle][/home/oracle]#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
F3931284   0614022413 I H ent3           ETHERNET NETWORK RECOVERY MODE
F3931284   0614022413 I H ent0           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022413 T H ent3           ETHERNET DOWN
EC0BCCD4   0614022413 T H ent0           ETHERNET DOWN
F3931284   0614022213 I H ent0           ETHERNET NETWORK RECOVERY MODE
F3931284   0614022213 I H ent3           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022213 T H ent0           ETHERNET DOWN
F3931284   0614022213 I H ent0           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022213 T H ent0           ETHERNET DOWN
F3931284   0614022213 I H ent0           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022213 T H ent0           ETHERNET DOWN
F3931284   0614022213 I H ent0           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022213 T H ent0           ETHERNET DOWN
F3931284   0614022213 I H ent0           ETHERNET NETWORK RECOVERY MODE
EC0BCCD4   0614022213 T H ent3           ETHERNET DOWN
EC0BCCD4   0614022213 T H ent0           ETHERNET DOWN


网络查过,网络的人说没问题。

每周都会发生。
参与26

25 同行回答

kanter2008 kanter2008 系统工程师 上海***
保证心跳稳定就对了,还可以设置高超时时间这类参数,太敏感容易有问题。多找找发生的规律吧,也许跟备份时产生IO有关,只是推测。剩下的就看运气了。显示全部
保证心跳稳定就对了,还可以设置高超时时间这类参数,太敏感容易有问题。
多找找发生的规律吧,也许跟备份时产生IO有关,只是推测。
剩下的就看运气了。 收起
互联网服务 · 2014-09-18
浏览2493
chenqiang2942 chenqiang2942 系统工程师 软通动力
解决了吗 ,你这个问题,我公司也发现这样的问题,我们2套数据库RAC 心跳接的交换机,也提示心跳失败 导致重启,下月还想试试直连呢显示全部
解决了吗 ,你这个问题,我公司也发现这样的问题,我们2套数据库RAC 心跳接的交换机,也提示心跳失败 导致重启,下月还想试试直连呢 收起
系统集成 · 2014-08-28
浏览2570
kanter2008 kanter2008 系统工程师 上海***
我把这垃圾系统,改了心跳参数。试过改交换机做心跳。也没有好。工作调整,这系统给别人了也TMD好了。我日。尽人事,还得要考天命啊。显示全部
我把这垃圾系统,改了心跳参数。试过改交换机做心跳。也没有好。
工作调整,这系统给别人了也TMD好了。
我日。
尽人事,还得要考天命啊。 收起
互联网服务 · 2014-08-07
浏览2447
tttzzz22 tttzzz22 QA工程师 安徽合肥
这个问题我今天也遇到了,据说跟心跳有关系?显示全部
这个问题我今天也遇到了,据说跟心跳有关系? 收起
IT分销/经销 · 2013-12-18
浏览2534
feidaodao feidaodao 系统运维工程师 GA
先写脚本备到本机硬盘上,去掉NBU备份观察呢。显示全部
先写脚本备到本机硬盘上,去掉NBU备份观察呢。 收起
金融其它 · 2013-06-18
浏览2453
hanbing hanbing 软件开发工程师 lgcns
找赛门铁克解决啊,nbu的bug吧显示全部
找赛门铁克解决啊,nbu的bug吧 收起
互联网服务 · 2013-06-18
浏览2504
fhqjgd fhqjgd 系统工程师 江苏巨鸿
回复  fhqjgd 我当时是个NBU里的一个RMAN作业造成的。在allocate 语句分配通道时 加rate = 5M 这个速度限 ...kanter2008 发表于 2013-6-17 15:55      谢谢,我试试看。显示全部
回复  fhqjgd

我当时是个NBU里的一个RMAN作业造成的。在allocate 语句分配通道时 加rate = 5M 这个速度限 ...
kanter2008 发表于 2013-6-17 15:55



     谢谢,我试试看。 收起
互联网服务 · 2013-06-17
浏览2596
kanter2008 kanter2008 系统工程师 上海***
回复 18# fhqjgd 我当时是个NBU里的一个RMAN作业造成的。在allocate 语句分配通道时 加rate = 5M 这个速度限制。资源占用下来了就好了。你根据你自己情况吧。其实这种有规律的故障还好些,就平那些没规律的故障啊。...显示全部
回复 18# fhqjgd

我当时是个NBU里的一个RMAN作业造成的。在allocate 语句分配通道时 加rate = 5M 这个速度限制。资源占用下来了就好了。你根据你自己情况吧。其实这种有规律的故障还好些,就平那些没规律的故障啊。 收起
互联网服务 · 2013-06-17
浏览2584
fhqjgd fhqjgd 系统工程师 江苏巨鸿
回复  fhqjgd 对于你的现象,我感觉很可能是NBU引起的。 我就遇到过RMAN备份太占资源导致问题。建议你再 ...kanter2008 发表于 2013-6-17 10:52   那怎么办?不备份了?  而且我是晚上21:00开始备份那时候没人用。备份是正常的也没有报错。出现...显示全部
回复  fhqjgd

对于你的现象,我感觉很可能是NBU引起的。 我就遇到过RMAN备份太占资源导致问题。
建议你再 ...
kanter2008 发表于 2013-6-17 10:52



  那怎么办?不备份了?  而且我是晚上21:00开始备份那时候没人用。备份是正常的也没有报错。出现问题是在晚上1点早上10点左右,每天都会间歇性出现几次。 收起
互联网服务 · 2013-06-17
浏览2571
kanter2008 kanter2008 系统工程师 上海***
回复 14# fhqjgd 对于你的现象,我感觉很可能是NBU引起的。 我就遇到过RMAN备份太占资源导致问题。建议你再查查看。我当时因为RMAN不限制,引起SQLPLUS 连接都要延迟10秒,影响了应用。显示全部
回复 14# fhqjgd

对于你的现象,我感觉很可能是NBU引起的。 我就遇到过RMAN备份太占资源导致问题。
建议你再查查看。
我当时因为RMAN不限制,引起SQLPLUS 连接都要延迟10秒,影响了应用。 收起
互联网服务 · 2013-06-17
浏览2521

提问者

kanter2008
系统工程师 上海***
擅长领域: 服务器AIXUnix
评论239

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2013-06-14
  • 关注会员:1 人
  • 问题浏览:19579
  • 最近回答:2014-09-18
  • X社区推广