查看其它 1 个回答rein07的回答

rein07rein07系统架构师某证券

HBase是基于Hdfs的分布式列式数据库,所有的查询和写入都以Rowkey作为基础。所以业务设计时最重要的是Rowkey设计,需要注意的有以下几点:
1) 常用查询字段放在Rowkey前面
2) 保证数据均匀散列

    Rowkey设计不合理会导致数据倾斜,从而产生数据读写热点。

3) 保证数据唯一性
HBase写入时会根据Rowkey去重,所以Rowkey不唯一会导致数据丢失。
4) ColumnFamily不宜太多,会影响数据查询效率,可以采用多个Qualifier实现。

证券 · 2018-10-19
浏览1396

回答者

rein07
系统架构师某证券
擅长领域: 人工智能大数据机器学习

rein07 最近回答过的问题

回答状态

  • 发布时间:2018-10-19
  • 关注会员:2 人
  • 回答浏览:1396
  • X社区推广