HBase是基于Hdfs的分布式列式数据库,所有的查询和写入都以Rowkey作为基础。所以业务设计时最重要的是Rowkey设计,需要注意的有以下几点:1) 常用查询字段放在Rowkey前面2) 保证数据均匀散列 Rowkey设计不合理会导致数据倾斜,从而产生数据读写热点。3) 保证数据唯一性...
显示全部HBase是基于Hdfs的分布式列式数据库,所有的查询和写入都以Rowkey作为基础。所以业务设计时最重要的是Rowkey设计,需要注意的有以下几点:
1) 常用查询字段放在Rowkey前面
2) 保证数据均匀散列
Rowkey设计不合理会导致数据倾斜,从而产生数据读写热点。
3) 保证数据唯一性
HBase写入时会根据Rowkey去重,所以Rowkey不唯一会导致数据丢失。
4) ColumnFamily不宜太多,会影响数据查询效率,可以采用多个Qualifier实现。
收起