移动经分系统DB2 DPF高可用如何实现?

现在移动的经分系统,都是用的DB2 DPF,像我们这边的经分仓库就是由6台HP-UX主机15个节点构成,前段时间就是因为一个复杂的SQL导致NODE 0直接crash掉,导致整个库不可用,有没有一种可靠的方案为DPF环境提供高可用。

我在网上也看了好多,利用HA做双机,具体的实施方案不清楚,或者有没有更好的方案,请大家讨论,谢谢。

参与48
  • 对于这种问题来说,高可用是无法做到解决问题的,只能从SQL层面调整优化,DPF本身虽然说是share nothing的结构,但是通常catalog节点是目录节点,很多表的catalog信息都存在这个节点,所以这个节点down掉就会影响整个系统,除非你在设计应用的时候,各个分区节点表的数据分散,并且各个查询都不会交叉运行在所有节点,这样才能做到down掉一个节点其他节点不受影响,DPF如果一个节点的表出现坏块,任何查询改表的数据的数据库都会down掉,这个也是数据ACDI的特点决定的
    2015-11-05

13同行回答

陈宇陈宇系统工程师某银行
node 0为什么crash?应该是db2自己crash。双机热备主要是预防硬件掉电或者当机,在这个场景感觉没必要。显示全部

node 0为什么crash?应该是db2自己crash。双机热备主要是预防硬件掉电或者当机,在这个场景感觉没必要。

收起
银行 · 2015-11-04
浏览1803
windywindy数据库管理员KSRCB
你说的这种情况确实是目前比较典型和常见的现象,我暂且称它是现象而不是故障。之所以称它为现象而不是故障,这是根据数据仓库的应用特点和DPF的share nothing 架构来说的。我所见到的数据仓库,大多是在系统层面做了HA,比如AIX的HACMP、Linux的RHCS等,以保证当一台服务器出现故...显示全部

你说的这种情况确实是目前比较典型和常见的现象,我暂且称它是现象而不是故障。之所以称它为现象而不是故障,这是根据数据仓库的应用特点和DPF的share nothing 架构来说的。

我所见到的数据仓库,大多是在系统层面做了HA,比如AIX的HACMP、Linux的RHCS等,以保证当一台服务器出现故障时的资源切换,然而在实际的生产中貌似是很少切换的,除非是故障的服务器真的不可用了才会去切,因为切换动作比较大,一般需要经过层层审批,需要惊动领导,还有就是切换后真的跑得很慢。

这种做法也是基于数据仓库的应用特点实行的,不像在线交易系统,必须保证7*24小时online。所以个人认为没有必要一发生节点crash,就马上进行切换。实际情况下,一般都有故障处理的级别的,节点切换必然是很高的故障级别才需要做的。

至于您提到的HA实施的方案,例如hacmp,rhcs,网上有很多,官网也有教程,应该不难找到。

一点愚见,分享一下了,希望有帮助吧。

收起
IT咨询服务 · 2015-11-05
浏览1571
wolfopwolfop其它Why should I tell you?
从实际情况来看,部署了DB2 DPF的都没真的做HA,嘿嘿。实施太复杂。所以这样的架构实际中经常被挖苦不论主机还是存储都构成单点。理论上用GPFS的跨存储复制+TSA+cold standby节点做吧,相对实施简单点,也不会HA failover以后有性能损失。具体参考pure data for operational ana...显示全部

从实际情况来看,部署了DB2 DPF的都没真的做HA,嘿嘿。实施太复杂。所以这样的架构实际中经常被挖苦不论主机还是存储都构成单点。

理论上用GPFS的跨存储复制+TSA+cold standby节点做吧,相对实施简单点,也不会HA failover以后有性能损失。具体参考pure data for operational analytic架构。不过这东西是理论上存在,实际上有谁做过么?高度怀疑。

收起
IT其它 · 2015-11-11
浏览1512
huangdkhuangdk数据库架构师IBM
DPF本身就是share nothing的。你想一个节点crash了,其它节点继续服务?这个目前来说确实做不了。再说,crash后的CR,时间也不会特别长。显示全部

DPF本身就是share nothing的。你想一个节点crash了,其它节点继续服务?这个目前来说确实做不了。再说,crash后的CR,时间也不会特别长。

收起
IT咨询服务 · 2015-11-04
浏览1513
DB-TrendSetterDB-TrendSetter联盟成员数据库架构师公司
DB2 DPF为数据仓库OLAP设计,实时性要求没有OLTP那么严格,也没有很好的高可用方案。显示全部

DB2 DPF为数据仓库OLAP设计,实时性要求没有OLTP那么严格,也没有很好的高可用方案。

收起
电信运营商 · 2015-11-04
浏览1480
新数科技新数科技IT顾问北京新数科技有限公司
我们有完善的DPF高可用解决方案,通过GPFS文件系统,实现数据共享,同时通过TSAMP配置数据分区的切换。这一套方案已经在客户现场用过了,包括TSAMP脚本和GPFS实施步骤,还可以通过GPFS复制实现数据冗余。整个过程比较复杂,很难几句话描述清楚,如果有需要的话可以联系我们: chenck@new...显示全部

我们有完善的DPF高可用解决方案,通过GPFS文件系统,实现数据共享,同时通过TSAMP配置数据分区的切换。这一套方案已经在客户现场用过了,包括TSAMP脚本和GPFS实施步骤,还可以通过GPFS复制实现数据冗余。整个过程比较复杂,很难几句话描述清楚,如果有需要的话可以联系我们: chenck@newdt.cn, 18601359047, 我们公司核心成员都来自IBM,主要做DB2数据库的咨询服务。

收起
IT咨询服务 · 2015-11-04
浏览1525
weiruan85weiruan85数据库管理员ibm
前段时间就是因为一个复杂的SQL导致NODE 0直接crash掉,导致整个库不可用,有没有一种可靠的方案为DPF环境提供高可用双机互备也解决不了这个问题。显示全部

前段时间就是因为一个复杂的SQL导致NODE 0直接crash掉,导致整个库不可用,有没有一种可靠的方案为DPF环境提供高可用


双机互备也解决不了这个问题。

收起
政府机关 · 2015-11-04
浏览1523
bygt2010bygt2010it技术咨询顾问自由空间科技公司
嗯,有没有具体的操作手册借鉴一下。显示全部
嗯,有没有具体的操作手册借鉴一下。收起
IT咨询服务 · 2015-11-04
浏览1500
huangdkhuangdk数据库架构师IBM
DB2自带的TSAMP就行了。可以双机互备;设置VIP。文件系统推荐GPFS显示全部

DB2自带的TSAMP就行了。可以双机互备;设置VIP。文件系统推荐GPFS

收起
IT咨询服务 · 2015-11-04
浏览1470
jxufejxufe其它jxcl
aix和linux有办法用gpfs的failure group ,hpux不太清楚显示全部

aix和linux有办法用gpfs的failure group ,hpux不太清楚

收起
IT其它 · 2016-06-14
浏览1236

提问者

bygt2010
it技术咨询顾问自由空间科技公司

相关问题

相关资料

问题状态

  • 发布时间:2015-11-04
  • 关注会员:13 人
  • 问题浏览:8493
  • 最近回答:2016-06-14
  • X社区推广