集群只是物理层面应用,如果数据库出现问题就没辙了

由于现在大多数客户的核心业务都是24小时连续不断的运行,在低成本的情况下为了实现高可用性,大多数情况都是采用双机集群等形式,如果客户舍得花钱的情况下可能会上容灾备份系统等。但我理解像双机集群形式都是一些物理层面出现故障比如一台主机硬件故障宕机了,另外一台主机接...显示全部
由于现在大多数客户的核心业务都是24小时连续不断的运行,在低成本的情况下为了实现高可用性,大多数情况都是采用双机集群等形式,如果客户舍得花钱的情况下可能会上容灾备份系统等。但我理解像双机集群形式都是一些物理层面出现故障比如一台主机硬件故障宕机了,另外一台主机接管运行。但是如果说是oracle数据库本身出现问题了,我们该怎么处理?能不能有一套方案能达到当正在运行数据库自身出现故障后,其他数据库能够替代继续对外服务。oracle RAC是不是也不能达到这个要求啊,因为所有的节点应该是共用一份datafiles和controlfiles吧,如果这两个文件损坏了也没辙吧。是不是只有容灾备份系统才能达到这一要求呢?所以想和大家探讨一下。收起
参与28

返回zhaoyubin的回答

“答”则兼济天下,请您为题主分忧!
zhaoyubinzhaoyubin其它XXX
1.HA也好,异地容灾也好,Oracle软件层面的灾备也好。其实都是有各自的适用范围的。即使把所以的都用上也不一定能够保证绝对的数据安全的。只能说是尽最大限度的去保证客户数据的安全性。
2.如果是小机物理层面上的宕机的话,HA比较合适。存储物理层面上的宕机,或者因为种种软件原因,异地容灾作用大些。(但这不是绝对的,因为现实生产中,切换生产系统是一个比较危险的动作,无论是工程师和客户本身都是很慎重的)
3.数据库本身的问题是需要视情况而定的。
如果是参数错误,改回来就是了。如果是ORACLE本身的bug问题,可以选择跟新数据库版本、打补丁之类的。(我曾经接触过paging in比较大,然后干掉了2个比较大的进程,主数据库暂时恢复了。客户后来选择了升级数据库,然后好几年都没发生过类似现象)数据库本身是有归档的,可以选择恢复的。实时的恐怕还没法做到,因为楼主你的数据库本身出现问题了是个很宽泛的问题。在什么时间该切换,什么情况下切换。这要是物理层面上还好,逻辑层面上的出错可能性太多了,交给程序本身去判断是否切换或者回退,完全不用人去干预,这风险太大了些。根据我所接触到的客户来看,平时连设备重启都很小心,他们绝对没这么放心在逻辑层面上也这么干。
农业其它 · 2013-11-21
浏览711

回答者

zhaoyubin
其它XXX
擅长领域: 虚拟化云计算PowerVM

回答状态

  • 发布时间:2013-11-21
  • 关注会员:1 人
  • 回答浏览:711
  • X社区推广