银行

hive和spark都提供类sql的接口，各适合什么样的应用场景？

hive和spark都提供类sql的接口，各适合什么样的应用场景。spark是否适用于像日终批量处理这种大批量数据的加工？基于mllib的分析对开发者要求较高，是否有可视化工具或者简单的分析工具去方便业务人员去用？

参与8

5同行回答
全部行业
全部行业 电信运营商 银行
|
按赞同排序
按时间排序

华强系统架构师某银行

目前有没有一些开源成熟的组件可以引入呢？

朱祥磊系统架构师某移动公司

嗯，这种情况下，我们打算引入分布式内存库技术，比如hana、比如gemfire等

电信运营商 · 2016-07-15

华强系统架构师某银行

即席查询也会存在高并发的场景，这是spark不擅长的领域。返回数据量大的时候，譬如明细类的查询，可能会出现spark不稳定的情况

朱祥磊系统架构师某移动公司

基于mllib的分析对开发者要求较高，编程复杂，考虑到开发难度，应该尽量避免编程，建议采用成熟的产品替代实现。

电信运营商 · 2016-07-15

朱祥磊系统架构师某移动公司

hive适合数据仓库类处理，批量统计查询。

spark适合即席查询等实时类业务场景。

电信运营商 · 2016-07-15