pureScale集群模式下,如果发现DDL操作慢,需要分析一下是否包含了大量分区,曾经发现建一张550个分区的表花了1分多钟,这也属正常。如果发现任何操作都慢,不只是DDL操作,这就需要检查一下RDMA通讯是否正常了,曾经有个客户就碰到ROCE卡工作不正常导致任何操作都慢的问题。如果使用最新的V11.1版本,产品提供环境验证功能,使用db2cluster -verify命令进行检查;如果是早期版本,需要下载单独的db2ClusterPing工具验证RDMA通讯是否正常。
db2ClusterPing 免费下载的Link如下:
http://www-01.ibm.com/support/docview.wss?uid=swg21967473
请注意,db2ClusterPing屏幕输出通讯是否正常的提示(PASS或FAIL),需要检查日志文件,里面提供了RDMA通讯延时信息:round-trip average,如果连接到同一个交换机上的2个ROCE口通讯,正常是15微秒左右,每多跨一个交换机增加15微秒。典型的2交换机拓扑架构,通常最慢不能超过35微秒。如果再慢,就需要检查交换机相关配置了。
收起