参与5

查看其它 1 个回答呱呱爱吃瓜的回答

呱呱爱吃瓜数据仓库工程师银行

1, 可以结合开源的搜索引擎 Apache Lucene ， Solr 或 ElasticSearch
2, 海量数据的实时检索可以考虑 HBase ，建议可以使用 hadoop 将数据构建成以查询 key 为键的数据集，然后将集合写入 Hbase 表中， Hbase 会自动以 key 为键进行索引，在数十亿甚至以上的级别下，查询 key 的 value 响应时间也估计再 10 毫秒内。
如果检索条件是多个组合的情况下，可以适当的设计多个 hbase 表格，这样的检索也是很快的，同时 Hbase 也是支持二级索引。在符合条件下查询， Hbase 也是支持 MapReduce 的，如果对响应时间要求不高的情况下，可以考虑将 hive 和 Hbase 系统结合来使用。
如果数据量不是很大的情况下也可以考虑支持类似 SQL 的 NOSLQ 系统。

银行 · 2020-03-05

Hadoop存储海量数据没有问题，但是如何能够做到海量数据的实时检索？

查看其它 1 个回答呱呱爱吃瓜的回答

回答者

呱呱爱吃瓜最近回答过的问题

回答状态

Hadoop存储海量数据没有问题，但是如何能够做到海量数据的实时检索？

查看其它 1 个回答呱呱爱吃瓜的回答

回答者

呱呱爱吃瓜 最近回答过的问题

回答状态

呱呱爱吃瓜最近回答过的问题