软件开发Hadoop hdfs spark mapreduce 数据引擎

数据引擎分析，hadoop和spark 如何选择？

hadoop和spark 如何选择？

现在一般公司都用hadoop的hdfs进行存储，用spark做数据引擎分析。也有用mapreduce分析的。这2个怎么选择呢？

参与25

查看其它 3 个回答美国队长的回答

美国队长研发工程师Alibaba

mapreduce适用于数据量比较大这个跟其底层的实现有关因为他并不是完全依赖于内存，而spark拼的就是内存，如果响应速度要快而且数据量不是很大的时候，可以考虑使用spark，

互联网行业中一般离线的数据会考虑MR去跑，实时采用spark

互联网服务 · 2015-10-14

浏览1789

查看赞同的人

lufeng1102
请教一个问题，如果数据量大，是不是Spark就不适合，或者说适合，要看配多少内存，如一次分析20TB数据，但是MR的shuffle的效率问题是个硬伤啊。
2015-10-15
赞同
评论

添加评论

回答者

研发工程师Alibaba

擅长领域：大数据，大数据平台，数据库

评论172

美国队长最近回答过的问题

hadoop+spark 集群环境资源预估？

ambari的HADOOP集群，下SPARK2 HIVE HBASE等组件整合问题，类找不到？

问下页面发送请求，然后分布式计算再把结果返回给请求端，这个可以用spark实现吗？

基于hbase的用电信息采集系统如何设计？

Hadoop格式化时报错？

回答状态

发布时间：2015-10-14

关注会员：5 人

回答浏览：1789

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广