hadoop是一个ECOSYSTEM。HBASE是用来做随机查询的实时在线高并发的数据库,一般针对最终用户,比如联通用户查自己的上网记录,可以客户端,包括IOS,ANDROID来查,10010来查,电话投诉客服查询;HIVE是用来出统计报表,更强调顺序读写,离线批处理计算,要求吞吐,但不要求高并发。SQOOP是导入导出工具,传统关系数据库和HADOOP之间的桥梁。SPARK是计算引擎,正在替换MAPREDUCE。Hive over HDFS的性能比Hive over HBase的好,随着数据量的增大和计算的复杂,两者的差距也越来越大。