|
DPF |
MDC |
Table Partition |
中文名称 |
数据库分区特性 |
多维聚类 |
表分区 |
建表语句 |
DISTRIBUTE BY HASH |
ORGANIZE BY DIMENSION |
PARTITION BY RANGE |
特性 |
将行均匀地分布在多个数据库分区上 |
将在多个维上具有近似值的行放在表中相同的物理位置,即所谓的块 |
将所有行放在同一个数据分区的一个指定范围的维中 |
使用场景 |
大型表——大到无法仅依靠单独一组 CPU 和 I/O 通道来处理 |
结果集返回在多个维上具有近似值的行的查询 |
这种类型的表:周期性地添加大量数据,然后在数据到期后又删除大量数据 |
优点 |
可伸缩性——随着数据库的增长增加计算资源(也就是数据库分区) |
查询性能——组织数据的方式有利于获得更快的检索速度,对于由多个谓词指定范围的查询尤其有效 |
数据移动——通过添加和删除整个数据分区,可以增加和删除大量数据 |
设计注意事项 |
1.对于大型 BI 应用程序,可以使用数据库分区以提高其可扩展性。 2.在选择分区键时,同时还要关注分区键值的高基数并提高连接中的表并置。对不共享数据库来说,使用哈希分区完全是为了数据仓库 |
1.MDC 可用来提高查询性能以及转入和转出数据。 2.使用表分区来转出或在一个单独的维度通过使用 MDC 来转入 |
1.RCTs)来进行对数据的快速直接的访问。 2.基于转入和转出特点来设计表分区。根据 month 或财季来进行分区是很好的策略 |
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞1
添加新评论1 条评论
2011-07-29 08:38