系统集成spark yarn 内存计算 hive

请问一下，在内存计算的使用上，大家都采用什么模式呢？

1、、在内存计算这方面，请问一下大家使用Spark Standalone模式，还是On Yarn模式呢？或者使用其他什么模式？
2、使用Hive on Spark 较多呢？还是直接使用Spark SQL直接处理问题呢？

参与14

2同行回答
全部行业
全部行业 证券 互联网服务
|
按赞同排序
按时间排序

rein07系统架构师某证券

应该是spark on yarn多些，基于yarn的任务管理方便，且有助于资源的统一管理。
2、spark sql比hive sql要新一点，两者都可以使用，像我们更多的是直接使用spark core，还是看场景吧。

证券 · 2017-07-04

浏览3686

查看赞同的人

美国队长研发工程师Alibaba

spark on yarn 因为目前而言yarn在资源管理方面还是能够接受的，虽然也或多或少有些问题

hive on spark 跟spark sql，都是基于spark引擎来做数据计算的，hive on spark多了一层hive解析，而spark sql直接利用spark框架进行分析计算

互联网服务 · 2017-07-04

浏览2448

查看赞同的人

提问者

网站架构师iwhalecloud

擅长领域：大数据，大数据平台，服务器

评论66

问题来自

活动 - 大数据处理平台技术产品选型探讨

相关问题

如何处理大数据集群因集群HIVE组件缓慢导致元数据库MYSQL的异常问题？

关于用于建模和机器学习的技术方案？

能否推荐一下大数据spark在冶金制造业相关项目经验和书籍？

请教大数据spark专业问题？

如何发现定位大数据集群中因集群HIVE组件缓慢导致元数据库MYSQL的异常问题？

相关资料

Spark快速大数据分析

分布式hadoop与spark集群搭建

Spark性能优化指南

Spark The Definitive Guide

SparkCore快速入门详解

问题状态

发布时间：2017-07-04

关注会员：4 人

问题浏览：6510

最近回答：2017-07-04

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广