Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

问题

互联网服务Hadoop·2017-08-09
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
从问题来看是你的Class版本问题,可以从下面几个方面入手1.你之前有没有格式化过,如果有就把之前的指定元数据路径给删了当然这是建立在没有数据需要备份的情况2.你能否贴一下你的格式化界面打印的完整日志3.你的hadoop在安装的时候有没有引入别的包导致两个包的版本不兼容...
银行Hadoop·2017-08-08
haizdl · 大连 擅长领域:灾备, 存储, 服务器
1235 会员关注
对于金融行业来讲,非结构化数据的业务相对比结构化业务重要度低很多。搞双活的情况不太多。一般容灾方式就是个数据复制。
软件开发大数据·2017-07-27
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
市面上再好的教材也没有自己动手去写,我建议你看学习视频,然后找例子去模仿,然后去了解例子的代码意思,循环迭代,就会进入角色
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
584 会员关注
当遇到海量数据需要存储和分析时,都可能会用到大数据产品,因为大数据产品最重要的特点就是分布式,效率高,且每一款产品都针对特定应用场景,如hbase、spark、hive等
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
584 会员关注
1、首次用Hadoop生态圈内的各个组件,最困难的是使用模式的转变,不像SQL一统天下的传统数据看那么容易上手。2、面对分布式引擎,遇到问题没有办法排查,因为你根本不知道你的程序在那里执行以及执行到哪里了,不像单机程序,到日志目录下看日志。3、遇到组件报错无从下手解决,只能不...
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
584 会员关注
五年前已经需要处理每天百亿级数据量的时候。。
电信运营商partition revoke·2017-07-26
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
请问你代码具体做了什么操作,另外partition你用了指定了几个
银行hbase·2017-07-25
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
你这个问题造成的原因很多,我觉得最大的可能是节点之间网络连接超时,但是用hbase进行数据统计,你可以采用hbase的协处理器,每次做个累积,这样速度会快一些,
银行大数据·2017-07-24
星星峡的风 · 福建新大陆软件有限公司 擅长领域:数据库, 系统运维, 服务器
73 会员关注
找个培训班上,这是最靠谱的办法(前提是能跟上课程进度)。
银行大数据·2017-07-24
星星峡的风 · 福建新大陆软件有限公司 擅长领域:数据库, 系统运维, 服务器
73 会员关注
我做运维,所以就都懂一些但都不精通,我仔细思考过关于在哪个技术方向深入学习的事,我的感受是,如果是dba那么就在这个方向上走下去,在mysql和主流的分布式数据库上下功夫,调优是个永无止境而且很吃技术的活,放弃自己打好的基础,去学一些别的基础知识,浪费了...

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
X社区推广
  • 提问题