如果想冗余数据的话可以使用hive,查询的时候使用spark sql,但是hive底层走的是mapreduce,比较慢,你可以尝试将hive的底层驱动换成spark sql,还可以将数据冗余到hbase,如果涉及到多维度查询可以使用二级索引...
显示全部如果想冗余数据的话可以使用hive,查询的时候使用spark sql,但是hive底层走的是mapreduce,比较慢,你可以尝试将hive的底层驱动换成spark sql,
还可以将数据冗余到hbase,如果涉及到多维度查询可以使用二级索引
收起