lisp2009
作者lisp2009·2012-07-19 09:02
数据库管理员·浙商银行

三天PureScale测试

字数 3328阅读 6176评论 9赞 1
DB2的purescale听起来比Oracle的RAC好用的多,因此,我们几个同事去上海张江高科IBM对purescale进行学习和测试,有些收获: 一、测试环境

DB2 PureScale的测试环境如下表:

硬件环境

1)一台IBM P780物理主机,配2infiniband卡,每块卡上有2PORT。该主机划出4LPAR

2Infiniband交换机

3San交换机

4)存储为IBM DS5300

软件环境

DB2 PureScale V9.8 FP3

逻辑拓扑图如下:

在硬件、软件、实例等环境均准备就绪的情况下,针对db2 PureScale进行差异性测试、高可用性测试、扩展性测试。

二、差异性测试

差异性测试主要针对db2 PureScale的日常管理和维护进行一些验证性的操作,测试结果如下表所列:

测试内容

测试结果

过程分析

启停数据库

正常完成

沿用低版本的命令,但新增加了启停单个节点的参数。

db2stop [force] [member-id]

db2stop [CF-id]

db2stop 不指定参数,将停止整个purescalememberCF进程。

建实例

不可建

一套db2 purescale环境下只能创建一个实例,在purescale创建过程中建立。

建数据库

可建

需要注意CF的配置,否则会出现CF内存不足的问题,需手动指定CF的配置。可在建库时停止另一个库来释放内存,建好之后修改配置。

V9.8dbm cfgdb cfg增加了CF的配置参数。

建缓冲池

可建

创建的是LBP,可采用except member选项设置每个节点不同的缓冲池大小。

建表空间

可建

只能采用managed by automatic storage

如果有多个数据文件系统,新建的表空间就跨多个文件系统。

扩表空间

可扩

方法一、新建一个共享文件系统,然后将该文件系统加给数据库。已有表空间将顺序使用文件系统,不会做类似rebalance的操作。新建的表空间将同时跨越老的和新建的文件系统。注意需要修改文件系统owner权限。

方法二、直接从系统层面扩原有文件系统。往已有的GPFS里面加盘,加了盘之后会做rebalance

设置日志归档

可归档

修改归档配置参数,注意deactivation/activation数据库(否则修改参数后,虽然显示为已生效,但实质上未生效);

总的归档目录下面会创建各member自己的归档目录;

手工进行归档会将所有member的日志都归档;

归档日志序号各节点各维持一套(包括活动日志和归档日志)。

备份

可离线和在线备份

离线备份和在线备份方式与V9.1相同

备份时需要将归档日志的目录结构保存完整,以便于恢复时能找到并恢复各个member的日志。

恢复

可恢复

离线备份可恢复;

在线备份可恢复,日志前滚要所有节点的日志,将归档日志目录下的子目录全部一起归出来,会到归档目录下根据多个节点的日志进行前滚;

注意,备份恢复时要保证有足够的CF内存。

 

Purescale相关命令:

解释

命令

查看仲裁盘

db2cluster -CM -list –tiebreaker

查看集群状态

db2instance –list

查看CF内存使用

db2pd -d name –cfinfo

集群操作命令

db2cluster

查看CF同步情况

select * from ibmsysadm.db2_cfs

三、高可用性测试

高可用性测试模拟DB2 PureScale各主机故障情况对数据库应用的影响。测试结果如下表所列:

故障点

测试内容

测试方式

结果分析

数据库节点

计划内停止一个节点

手工停止一个节点

该节点可正常停止,对另一节点无影响。

命令:db2stop 1

一节点网络故障

禁用该节点网卡

连接至该节点的应用报错并中断一定时间,然后被好的节点接管。而该节点的状态此时为waiting for failback

注意:在客户端需要配置db2dsdriver.cfg文件,同时针对AIX系统需要配置tcp_keepcnttcp_keepidletcp_keepinittcp_keepintvl四个系统参数。一定时间由这些参数决定。

一节点上IB卡故障

手工禁用IB

连接至该节点的应用未报错,但其实已经很快地被另一节点接管。接管时间约2秒钟。

一节点上进程故障

手工杀掉该节点上db2sysc进程

进程被杀掉1秒钟后自动恢复,但是该节点上的应用连接被另一节点接管。

一节点宕机

手工shutdown该节点

连接到该主机的应用报错并中断,10秒钟后被另一节点接管,应用继续执行。

与网卡故障类似。

Standby CF

计划内停止辅CF

手工停止辅CF

对应用无影响。该辅的CF的状态为stoped

命令:db2stop CF 129

恢复后,状态依次为:restarting;catchup;peer

CF网卡故障

手工禁用网卡

对应用无影响。该辅的CF的状态为error

恢复后状态依次为:stopped;restarting;error;peer

CFIB卡故障

手工禁用IB

对应用无影响。该辅的CF的状态为stopped

恢复后状态依次为:stopped;peer

CF进程宕掉

手工kill CF进程

对应用无影响。被kill的进程将自动启动。

Primary CF

计划内停止主CF

手工停止主CF

对应用无影响。该主的CF的状态为stoped。辅的CF的状态为:primary

命令:db2stop CF 128

启动后,状态依次为:restarting;catchup;peer

CF网卡故障

手工禁用网卡

对应用无影响。该主的CF的状态为catch。辅的CF的状态为:primary

恢复后从catchuppeer花较长时间。

注:如果standby CF处于catchup,此时primary故障,整个purescale为保证数据一致性,将重启整个purescale集群,并将standby CF作为primary CF

CFIB卡故障

手工禁用IB

对应用无影响。该主的CF的状态为stopped。辅的CF的状态为:primary

恢复后状态依次为:stopped;peer

CF进程宕掉

手工kill CF进程

对应用无影响。15秒后辅的CF状态为primary,主的CF上被kill的进程将自动启动。

四、扩展性测试

扩展性测试主要针对DB2 purescale的扩展性进行测试,测试结果如下表所列:

测试内容

测试结果

结果分析

删除一个CF节点

可删除

删除一个CF节点对应用无影响

新增一个数据库节点

可添加

新增完成后,需要对数据库进行备份;

以前的备份数据将无法在新增节点的环境下恢复。

purescale数据库扩展操作均需要停止整个purescale集群。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论9 条评论

infosphereinfosphere软件实施顾问keyvalues
2014-11-28 14:30
好文
liyun9990liyun9990数据库管理员ibm gdc
2014-04-02 10:14
学习
zhendazhenda数据库管理员昆仑银行
2014-04-01 16:58
分享一下word文档不?
zhendazhenda数据库管理员昆仑银行
2014-04-01 16:55
学习了,最近我们也在测试,学习一下。
camydcamyd数据库管理员中储粮
2013-01-08 11:08
学习了……
uc804uc804数据库运维工程师企业
2012-08-08 10:02
lisp2009lisp2009数据库管理员浙商银行
2012-07-21 23:52
下面这个链接是在非infiniband卡的环境下搭建purescale的测试,学习了。
http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1207maoq/index.html?ca=drs-
kt563kt563数据库管理员交行卡中心
2012-07-19 10:25
(^-^)。了解下了,博主可以发帖子啊,附件中就可以了。
lisp2009lisp2009数据库管理员浙商银行
2012-07-19 09:04
从word文档粘贴过来的,逻辑图居然出不来,还有这排版只能将就着了。
Ctrl+Enter 发表

作者其他文章

相关问题

相关资料

X社区推广