Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

问题

互联网服务数据库·2017-04-24
bigdata_user · 博彦科技 擅长领域:数据库, 大数据, 大数据平台
52 会员关注
hadoop没有事物这一块。还有就是小数据量的查询效率没有普通数据库好,其实数据如果不是很多,不建议使用hadoop
互联网服务数据库·2017-04-24
bigdata_user · 博彦科技 擅长领域:数据库, 大数据, 大数据平台
52 会员关注
数据存储到hadoop以后,使用这些数据的时候,你要考虑使用那些组件,hive hbase等,数据建模要做好,
互联网服务spark·2017-04-24
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
spark跟hadoop用在不同的场景,spark用在实时吃内存,如果项目小或者考虑成本再加上对数据查询速度要求不高,就可以用hadoop,成本低,配置不要求搞
软件开发数据库·2017-04-24
bigdata_user · 博彦科技 擅长领域:数据库, 大数据, 大数据平台
52 会员关注
这个是可以共存的,你需要那部分数据,就查询什么就行了,你需要实时的hadoop分析的数据,你直接调用对应的接口查询hadoop就行了,你需要普通数据库里面的数据,直接查询普通数据库就行了,...
软件开发模型处理·2017-04-24
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
没有完全规定的模式,我个人理解的有数据压入,如sqoop,flume等,模型处理我理解成就是数据清洗这个一步方法多种多样考虑到后面还有数据汇总跟数据输出, 如果是规范性输入比如a|b|c等通过制定分隔符进行分割的,可以考虑使用hive,...
软件开发Hadoop·2017-04-21
bigdata_user · 博彦科技 擅长领域:数据库, 大数据, 大数据平台
52 会员关注
个版本之间的兼容性,hadoop的主备切换,数据仓库模型设计,现在使用的人很多,网上有很多资料
银行大数据·2017-04-21
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
大数据系统的灾备要求是根据不同的场景来定,比如数据业务要求比较高,那最好还是另外搞一个专门对系统数据进行备份,虽然大数据比如hdfs系统有多个版本的手段来防止数据丢失,但是毕竟这个冗余是建立在hadoop自身的一堆的通信基础上,如果这个通信出了异常你又没法恢复的时候,那hd...
互联网服务Hadoop·2017-04-21
bigdata_user · 博彦科技 擅长领域:数据库, 大数据, 大数据平台
52 会员关注
sqoop1比较好用,直接在终端执行对应的指令就行了,如果想控制可以写一个shell脚本,或者你可以看下kettle
银行大数据平台·2017-04-21
冯帅 · 贝壳金服 擅长领域:数据库, 关系型数据库, 数据库系统改造
309 会员关注
通过使用MapReduce的方式,使Hadoop可以直接访问Oracle,并将相关的数据写入到HDFS文件当中。 从而可以顺利地将Oracle中的数据迁移到Hadoop文件系统中。

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
X社区推广
  • 提问题