Hadoop分布式文件系统：架构和设计要点

正在加载中...

试读已结束

继续阅读请 1 金币购买后下载

资料简介：

Hadoop分布式文件系统：架构和设计要点

一、前提和设计目标

1、硬件错误是常态，而非异常情况，HDFS可能是有成百上千的server组成，任何一个组件都有可能一直失效，因此错误检测和快速、自动的恢复是HDFS的核心架构目标。

2、跑在HDFS上的应用与一般的应用不同，它们主要是以流式读为主，做批量处理；比之关注数据访问的低延迟问题，更关键的在于数据访问的高吞吐量。

3、HDFS以支持大数据集合为目标，一个存储在上面的典型文件大小一般都在千兆至T字节，一个单一HDFS实例应该能支撑数以千万计的文件。

4、 HDFS应用对文件要求的是write-one-read-many访问模型。一个文件经过创建、写，关闭之后就不需要改变。这一假设简化了数据一致性问题，使高吞吐量的数据访问成为可能。典型的如MapReduce框架，或者一个web crawler应用都很适合这个模型。

5、移动计算的代价比之移动数据的代价低。一个应用请求的计算，离它操作的数据越近就越高效，这在数据达到海量级别的时候更是如此。将计算移动到数据附近，比之将数据移动到应用所在显然更好，HDFS提供给应用这样的接口。

6、在异构的软硬件平台间的可移植性。

2016-02-23

页数9

下载23

已下载用户的评价7.78分

您还未下载该资料，不能发表评价；
查看我的待评价资源

刘乃昌项目经理苏州市软件评测中心2017-11-06

有用
感谢分享，值得学习！！

wengad软件开发工程师Pact2016-09-20

有用
不错的说*

louis0058项目总监gdsy2016-03-09

没用
谢谢提供

Hadoop分布式文件系统：架构和设计要点

已下载用户的评价7.78分

贡献者

TA的其他资料

相关资料

相关问题

相关文章