Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

问题

汽车Hadoop·2017-07-21
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
对于新手而言,可以从hadoop区分为hdfs mapreduce两块去对异常进行分类,然后可以百度看一下解决方式。当对hadoop有一定了解之后,可以通过异常的提示,结合自己对框架本身的理解去尝试定位问题...
汽车Hadoop·2017-07-21
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
培训机构的一些视频,还有一些hadoop相关的书籍,当然最重要的还是自己动手去写!
汽车Hadoop·2017-07-21
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
先学习java,再学习linux相关命令,接着尝试搭建hadoop环境,利用java写Mapreduce,接着去阅读hadoop源代码
金融其它大数据·2017-07-06
kaodaxia · 北京银企融合技术开发有限公司 擅长领域:大数据, 大数据平台, 分布式系统
47 会员关注
研发与运维有Devops连接,技术与业务也必然会连接,我对这个团队未来的定义是一个业务增长团队,不管是技术驱动还是数据驱动,不懂就不动,打死不动
银行mpp数据库·2017-07-06
haichuan0227 · 新浪云计算 擅长领域:云计算, 一体化运维, 私有云
353 会员关注
互联网行业,大多是走hadoop/spark/storm/EK流。MPP和Hadoop,罗列如下几点,可供选型参考: MPPHadoop数据规模TB级PB级扩展能力较低,单集群规模一般在100-节点较高,单集群规模可达4k-5k节点复杂查询分析性能较高较低响应实时性较高较低数据类型结构化结构化+非结构化开发门槛低,基于SQ...
系统集成多租户·2017-07-04
heraleign · iwhalecloud 擅长领域:大数据, 大数据平台, 服务器
130 会员关注
暂时只讨论第一个话题,内存计算和仓库计算我再单独提问,带来不便,还请谅解,谢谢!
互联网服务数据备份·2017-06-27
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
首先最基本的查看hadoop自带默认的一些监听端口,比如50070,10020等一般配置在hdfs-site.xml,mapred-site.xml,yarn-site.xml这几个文件中,修改成另外的端口,另外对hadoop集群的访问要设置ip过滤等措施其次是hadoop的job权限分为三层,一个是Servicelevel,就是控制所有用户对job的...
证券数据源·2017-06-21
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
586 会员关注
数据源都来自企业内部的众多系统。首先还是要看对数据有什么样的期望,毕竟技术只是实现的手段。
互联网服务spark·2017-06-20
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
题目应该是hive on spark 另外你这个异常可能是hive跟spark的版本不一致的原因,建议你看一下你的hive源码中的pom.xml里面依赖的spark是什么版本的
电信运营商大数据·2017-06-13
bryan · 金融研发 擅长领域:云计算, 容器, 容器云
335 会员关注
数据的生命周期和业务紧密相关,是业务属性,比如有的业务要求保存5年,有的业务要求保存3年。我们在做的过程中,生命周期是自行研发工具进行管理的。可以参考一下这个文章 https://talena-inc.com/media/Talena_Report_HadoopAdoption_2015.pdf...

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
X社区推广
  • 提问题