Hadoop
Hadoop
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

热点

Hadoop·2020-01-13
Tamic · 某保险 擅长领域:数据库, 关系型数据库, 数据库系统改造
5 会员关注
收藏1
金币1
系统集成虚拟化·2019-12-18
liuyangccu · 平安银行 擅长领域:大数据, 大数据平台, 分布式系统
1 会员关注
这个看公司选择,一般情况都是部署在独立物理机,节点越多,算力越强。部署在虚拟机群一般两种情况,一种是试验用,类似做个poc测试用,另一种有超大规模虚拟机群,像阿里,人家的机群性能比物理机性能强太多了。个人经验,普通hadoop机群从十几台到几百台这个规模的,没听说哪家用虚拟机集...
Hadoop·2019-10-30
yinxin · 某金融机构 擅长领域:数据库, 服务器, 云计算
975 会员关注
收藏1
金币1
Hadoop·2019-10-22
yh2022lat · 中国联通 擅长领域:服务器, 存储, 灾备
22 会员关注
收藏1
评价2
金币2
Hadoop·2019-08-15
匿名用户
收藏1
评价10
金币1
保险Hadoop·2019-08-27
王奇 · 阜新银行 擅长领域:大数据, 数据库, 商业智能
2 会员关注
OGG数据抽取和解析,KAFKA数据的传输,HBASE数据存储。这是最简单的如果需要计算一些指标,可以用SPARK-STREAMING.  特别提醒:大数据的每个组件应用的场景不一样,使用时一定要注意自己的应用场景...
Hadoop·2017-08-03
王磊磊 · 移动 擅长领域:服务器, 存储, 数据库
235 会员关注
NamenodeHA原理详解社区hadoop2.2.0release版本开始支持NameNode的HA,本文将详细描述NameNodeHA内部的设计与实现。为什么要NamenodeHA?NameNodeHighAvailability即高可用。NameNode很重要,挂掉会导致存储停止服务,无法进行数据的读写,基于此NameNode的计算(MR,Hive等)也无法完成...(more)
浏览2831
大数据处理·2019-03-25
yinxin · 某金融机构 擅长领域:数据库, 服务器, 云计算
975 会员关注
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。本文将介绍大数据系统一个最基本的组件:处理框架...(more)
浏览1534
大数据·2019-01-02
sxtycxx · 人工智能(计算机视觉) 擅长领域:存储, 灾备, 服务器
519 会员关注
大数据时代已经来临,教育行业作为社会大众共享的无形财富,其开放己成为数据整合和共享应用的前提条件。“十三五"期间有望形成和谐健康的行业生态。基础设施提供商、大数据服务商、数据挖掘与分析提供商、数据应用服务提供商、数据安全提供商、教育行政部门以及教育大数据...(more)
专栏: 活动总结
浏览5314

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。
X社区推广
  • 提问题