dpf数据库中分布键的选择?

请问dpf环境中,表的分布键选择的依据是什么呢?如果一个表的字段是一个分布键,那么这个字段还需要创建索引吗?

参与8

1同行回答

leilinleilin数据库管理员IBM
DPF表的分布键主要考虑经常大表关联的字段,并且字段的取值(cardinality)较多,如银行业务中的账号、卡号等,这样不仅数据在各分区分布均匀,表关联是coloation join,不需要分发数据到别的分区,关联性能好。分布键可以是多个字段,满足上述条件的情况 下,尽量用较少的字段做分布键。分...显示全部

DPF表的分布键主要考虑经常大表关联的字段,并且字段的取值(cardinality)较多,如银行业务中的账号、卡号等,这样不仅数据在各分区分布均匀,表关联是coloation join,不需要分发数据到别的分区,关联性能好。分布键可以是多个字段,满足上述条件的情况 下,尽量用较少的字段做分布键。

分布键上的索引不是必须的。有这么一种情况,两张大表A和B,关联条件是分布键, A表where条件过滤后的记录数很少,这时候如果B表在关联字段上有一条索引,Db2优化器会选择效率更高的NLJN,而不是哈希JOIN,这时B表分布键上建索引可能是值当的。

收起
IT其它 · 2017-11-28
浏览3518

提问者

ABC
ABC004
数据库运维工程师ABC

问题来自

相关问题

问题状态

  • 发布时间:2017-11-28
  • 关注会员:2 人
  • 问题浏览:5753
  • 最近回答:2017-11-28
  • X社区推广