查看其它 1 个回答呱呱爱吃瓜的回答

呱呱爱吃瓜呱呱爱吃瓜数据仓库工程师银行

1, 可以结合开源的搜索引擎 Apache Lucene , Solr 或 ElasticSearch
2, 海量数据的实时检索可以考虑 HBase ,建议可以使用 hadoop 将数据构建成以查询 key 为键的数据集,然后将 集合写入 Hbase 表中, Hbase 会自动以 key 为键进行索引,在数十亿甚至以上的级别下,查询 key 的 value 响应时间也估计再 10 毫秒内。
如果检索条件是多个组合的情况下,可以适当的设计多个 hbase 表格,这样的检索也是很快的,同时 Hbase 也是支持二级索引。在符合条件下查询, Hbase 也是支持 MapReduce 的,如果对响应时间要求不高的情况下,可以考虑将 hive 和 Hbase 系统结合来使用。
如果数据量不是很大的情况下也可以考虑支持类似 SQL 的 NOSLQ 系统。

银行 · 2020-03-05
浏览2205

回答者

呱呱爱吃瓜
数据仓库工程师银行
擅长领域: 大数据服务器数据库

呱呱爱吃瓜 最近回答过的问题

回答状态

  • 发布时间:2020-03-05
  • 关注会员:3 人
  • 回答浏览:2205
  • X社区推广