1、、在内存计算这方面,请问一下大家使用Spark Standalone模式,还是On Yarn模式呢?或者使用其他什么模式?2、使用Hive on Spark 较多呢?还是直接使用Spark SQL直接处理问题呢?
spark on yarn 因为目前而言yarn在资源管理方面还是能够接受的,虽然也或多或少有些问题
hive on spark 跟spark sql,都是基于spark引擎来做数据计算的,hive on spark多了一层hive解析,而spark sql直接利用spark框架进行分析计算
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30