DPF表的分布键主要考虑经常大表关联的字段,并且字段的取值(cardinality)较多,如银行业务中的账号、卡号等,这样不仅数据在各分区分布均匀,表关联是coloation join,不需要分发数据到别的分区,关联性能好。分布键可以是多个字段,满足上述条件的情况 下,尽量用较少的字段做分布键。分...
显示全部DPF表的分布键主要考虑经常大表关联的字段,并且字段的取值(cardinality)较多,如银行业务中的账号、卡号等,这样不仅数据在各分区分布均匀,表关联是coloation join,不需要分发数据到别的分区,关联性能好。分布键可以是多个字段,满足上述条件的情况 下,尽量用较少的字段做分布键。
分布键上的索引不是必须的。有这么一种情况,两张大表A和B,关联条件是分布键, A表where条件过滤后的记录数很少,这时候如果B表在关联字段上有一条索引,Db2优化器会选择效率更高的NLJN,而不是哈希JOIN,这时B表分布键上建索引可能是值当的。
收起