DB2 PureScale的测试环境如下表:
硬件环境 |
(1)一台IBM P780物理主机,配2块infiniband卡,每块卡上有2个PORT。该主机划出4个LPAR。 (2)Infiniband交换机 (3)San交换机 (4)存储为IBM DS5300 |
软件环境 |
DB2 PureScale V9.8 FP3 |
逻辑拓扑图如下:
在硬件、软件、实例等环境均准备就绪的情况下,针对db2 PureScale进行差异性测试、高可用性测试、扩展性测试。
二、差异性测试差异性测试主要针对db2 PureScale的日常管理和维护进行一些验证性的操作,测试结果如下表所列:
测试内容 |
测试结果 |
过程分析 |
启停数据库 |
正常完成 |
沿用低版本的命令,但新增加了启停单个节点的参数。 db2stop [force] [member-id] db2stop [CF-id] db2stop 不指定参数,将停止整个purescale的member和CF进程。 |
建实例 |
不可建 |
一套db2 purescale环境下只能创建一个实例,在purescale创建过程中建立。 |
建数据库 |
可建 |
需要注意CF的配置,否则会出现CF内存不足的问题,需手动指定CF的配置。可在建库时停止另一个库来释放内存,建好之后修改配置。 V9.8的dbm cfg和db cfg增加了CF的配置参数。 |
建缓冲池 |
可建 |
创建的是LBP,可采用except member选项设置每个节点不同的缓冲池大小。 |
建表空间 |
可建 |
只能采用managed by automatic storage。 如果有多个数据文件系统,新建的表空间就跨多个文件系统。 |
扩表空间 |
可扩 |
方法一、新建一个共享文件系统,然后将该文件系统加给数据库。已有表空间将顺序使用文件系统,不会做类似rebalance的操作。新建的表空间将同时跨越老的和新建的文件系统。注意需要修改文件系统owner权限。 方法二、直接从系统层面扩原有文件系统。往已有的GPFS里面加盘,加了盘之后会做rebalance。 |
设置日志归档 |
可归档 |
修改归档配置参数,注意deactivation/activation数据库(否则修改参数后,虽然显示为已生效,但实质上未生效); 总的归档目录下面会创建各member自己的归档目录; 手工进行归档会将所有member的日志都归档; 归档日志序号各节点各维持一套(包括活动日志和归档日志)。 |
备份 |
可离线和在线备份 |
离线备份和在线备份方式与V9.1相同 备份时需要将归档日志的目录结构保存完整,以便于恢复时能找到并恢复各个member的日志。 |
恢复 |
可恢复 |
离线备份可恢复; 在线备份可恢复,日志前滚要所有节点的日志,将归档日志目录下的子目录全部一起归出来,会到归档目录下根据多个节点的日志进行前滚; 注意,备份恢复时要保证有足够的CF内存。 |
Purescale相关命令:
解释 |
命令 |
查看仲裁盘 |
db2cluster -CM -list –tiebreaker |
查看集群状态 |
db2instance –list |
查看CF内存使用 |
db2pd -d name –cfinfo |
集群操作命令 |
db2cluster |
查看CF同步情况 |
select * from ibmsysadm.db2_cfs |
高可用性测试模拟DB2 PureScale各主机故障情况对数据库应用的影响。测试结果如下表所列:
故障点 |
测试内容 |
测试方式 |
结果分析 |
数据库节点 |
计划内停止一个节点 |
手工停止一个节点 |
该节点可正常停止,对另一节点无影响。 命令:db2stop 1 |
一节点网络故障 |
禁用该节点网卡 |
连接至该节点的应用报错并中断一定时间,然后被好的节点接管。而该节点的状态此时为waiting for failback。 注意:在客户端需要配置db2dsdriver.cfg文件,同时针对AIX系统需要配置tcp_keepcnt;tcp_keepidle;tcp_keepinit;tcp_keepintvl四个系统参数。一定时间由这些参数决定。 | |
一节点上IB卡故障 |
手工禁用IB卡 |
连接至该节点的应用未报错,但其实已经很快地被另一节点接管。接管时间约2秒钟。 | |
一节点上进程故障 |
手工杀掉该节点上db2sysc进程 |
进程被杀掉1秒钟后自动恢复,但是该节点上的应用连接被另一节点接管。 | |
一节点宕机 |
手工shutdown该节点 |
连接到该主机的应用报错并中断,10秒钟后被另一节点接管,应用继续执行。 与网卡故障类似。 | |
Standby CF |
计划内停止辅CF |
手工停止辅CF |
对应用无影响。该辅的CF的状态为stoped。 命令:db2stop CF 129 恢复后,状态依次为:restarting;catchup;peer |
辅CF网卡故障 |
手工禁用网卡 |
对应用无影响。该辅的CF的状态为error。 恢复后状态依次为:stopped;restarting;error;peer | |
辅CF的IB卡故障 |
手工禁用IB卡 |
对应用无影响。该辅的CF的状态为stopped。 恢复后状态依次为:stopped;peer | |
辅CF进程宕掉 |
手工kill CF进程 |
对应用无影响。被kill的进程将自动启动。 | |
Primary CF |
计划内停止主CF |
手工停止主CF |
对应用无影响。该主的CF的状态为stoped。辅的CF的状态为:primary。 命令:db2stop CF 128 启动后,状态依次为:restarting;catchup;peer |
主CF网卡故障 |
手工禁用网卡 |
对应用无影响。该主的CF的状态为catch。辅的CF的状态为:primary。 恢复后从catchup到peer花较长时间。 注:如果standby CF处于catchup,此时primary故障,整个purescale为保证数据一致性,将重启整个purescale集群,并将standby CF作为primary CF。 | |
主CF的IB卡故障 |
手工禁用IB卡 |
对应用无影响。该主的CF的状态为stopped。辅的CF的状态为:primary。 恢复后状态依次为:stopped;peer | |
主CF进程宕掉 |
手工kill CF进程 |
对应用无影响。15秒后辅的CF状态为primary,主的CF上被kill的进程将自动启动。 |
扩展性测试主要针对DB2 purescale的扩展性进行测试,测试结果如下表所列:
测试内容 |
测试结果 |
结果分析 |
删除一个CF节点 |
可删除 |
删除一个CF节点对应用无影响 |
新增一个数据库节点 |
可添加 |
新增完成后,需要对数据库进行备份; 以前的备份数据将无法在新增节点的环境下恢复。 |
注:purescale数据库扩展操作均需要停止整个purescale集群。
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞1
添加新评论9 条评论
2014-11-28 14:30
2014-04-02 10:14
2014-04-01 16:58
2014-04-01 16:55
2013-01-08 11:08
2012-08-08 10:02
2012-07-21 23:52
http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1207maoq/index.html?ca=drs-
2012-07-19 10:25
2012-07-19 09:04