hdfs
hdfs
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的...(more)
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

问题

电信运营商数据库·2015-05-15
王老师能不能给解答一下一个简单问题。scala才开始学不太会在官方的mlib里面,fpgw算法是这样写的:http://spark.apache.org/docs/latest/mllib-frequent-pattern-mining.htmlimport org.apache.spark.rdd.RDDimport org.apache.spark.mllib.fpm.{FPGrowth, FPGrowthModel}v...(more)
浏览1841
软件开发数据库·2015-05-15
尘世随缘 · 上海某互联网金融公司 擅长领域:云计算, 云原生, 微服务
86 会员关注
HBASE没有连接到zookeeper上导致的问题,请确认zk是否已经启动了。
IT咨询服务数据库·2015-05-15
尘世随缘 · 上海某互联网金融公司 擅长领域:云计算, 云原生, 微服务
86 会员关注
HBASE本身就是为非结构化数据来做数据存储的,HBASE最终存入到hadoop的也是文件方式的。
软件开发数据库·2015-05-15
尘世随缘 · 上海某互联网金融公司 擅长领域:云计算, 云原生, 微服务
86 会员关注
hive可以访问hbase的表,同时hbae也可以访问hive的表。因为都是基于hdfs的文件访问。因此数据只有一份,存放于hdfs上。目前用的最多的是hive去访问hbase的表,因为hbase的rowkey是经过特殊优化的,以提高访问速率。反过来的话,rowkey优化存在问题。何时去建表无所谓,其实hive做的...
软件开发数据库·2015-05-15
尘世随缘 · 上海某互联网金融公司 擅长领域:云计算, 云原生, 微服务
86 会员关注
eclipse上的hadoop插件的用途是用来做开发和调试使用,如果在eclipse上去调优上传的速度这个没有任何实际意义。现实生产环境中,如果希望调优上传的速度,可以从以下几个方面考虑问题:1、网络:交换机调整为万兆交换机2、网络:各服务器尽可能保证在同一个网段3、硬件:服务器的硬盘...
电信运营商数据库·2015-02-12
杨博课题专家组 · 某科技公司 擅长领域:数据库, 服务器, 人工智能
233 会员关注
回复 1# beyondmch     是的。需要后续挖掘,hadoop仅仅是个工具。是的,使用Hive或mr结合数据仓库来做。是的。
互联网服务大数据·2015-02-05
类似像Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,那么基于分布式系统架构的环境下如何实现灾难备份呢?类似
浏览2610
互联网服务hdfs·2014-09-30
杨博课题专家组 · 某科技公司 擅长领域:数据库, 服务器, 人工智能
233 会员关注
很不错的文档。感谢楼主奉献。

描述

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的...(more)
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。
X社区推广
  • 提问题