HDFS架构包括什么?

参与3

1同行回答

呱呱爱吃瓜呱呱爱吃瓜数据仓库工程师银行
HDFS ( Hadoop Distribute FileSystem )分布式文件存储系统。它易于扩展的分布式文件系统,而且运行在大量廉价机器上,并且提供容错机制为大量用户提供性能不错的文件存取服务NameNode-- NameNode 主要功能:1 、接受客户端的读 / 写服务。2 、接受 DN 汇报的 block 位置信息。-...显示全部

HDFS ( Hadoop Distribute FileSystem )分布式文件存储系统。它易于扩展的分布式文件系统,而且运行在大量廉价机器上,并且提供容错机制为大量用户提供性能不错的文件存取服务

NameNode

-- NameNode 主要功能:

1 、接受客户端的读 / 写服务。

2 、接受 DN 汇报的 block 位置信息。

-- NameNode 保存 metadate 元信息。

基于内存存储 :不会和磁盘发生交换 ;

metadate 元数据信息包括以下:

• 文件 owership( 归属 ) 和 permissions( 权限 )

• 文件大小 时间

•Block 列表 [ 偏移量 ] :即一个完整文件有哪些 block ( b0+b1+b2+..=file )

• 位置信息 =Block 每个副本保存在哪个 DataNode 中(由 DataNode 启动时上报给 NN 因为会随时变化 , 不保存在磁盘) -- 动态的 !

-- NameNode 的 metadate 信息在启动后会加载到内存

•metadata 存储到磁盘文件名为 ”fsimage” 的镜像文件

•Block 的位置信息不会保存到 fsimage

•edits 记录对 metadata 的操作日志

DataNode

– 存储数据( Block )

– 启动 DN 线程的时候会向 NameNode 汇报 block 位置信息

– 通过向 NN 发送心跳保持与其联系( 3 秒一次),如果 NN 10 分钟没有收到 DN 的心跳,则认为其已经 lost ,并 copy 其上的 block 到其它 DN

SecondryNode

辅助 NameNode 定期合并 fsimage 和 edits -> new fsimage

收起
银行 · 2019-12-31
浏览1510

提问者

Tamic
数据库架构师某保险

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-12-30
  • 关注会员:2 人
  • 问题浏览:2293
  • 最近回答:2019-12-31
  • X社区推广