HDFS ( Hadoop Distribute FileSystem )分布式文件存储系统。它易于扩展的分布式文件系统,而且运行在大量廉价机器上,并且提供容错机制为大量用户提供性能不错的文件存取服务
NameNode
-- NameNode 主要功能:
1 、接受客户端的读 / 写服务。
2 、接受 DN 汇报的 block 位置信息。
-- NameNode 保存 metadate 元信息。
基于内存存储 :不会和磁盘发生交换 ;
metadate 元数据信息包括以下:
• 文件 owership( 归属 ) 和 permissions( 权限 )
• 文件大小 时间
•Block 列表 [ 偏移量 ] :即一个完整文件有哪些 block ( b0+b1+b2+..=file )
• 位置信息 =Block 每个副本保存在哪个 DataNode 中(由 DataNode 启动时上报给 NN 因为会随时变化 , 不保存在磁盘) -- 动态的 !
-- NameNode 的 metadate 信息在启动后会加载到内存
•metadata 存储到磁盘文件名为 ”fsimage” 的镜像文件
•Block 的位置信息不会保存到 fsimage
•edits 记录对 metadata 的操作日志
DataNode
– 存储数据( Block )
– 启动 DN 线程的时候会向 NameNode 汇报 block 位置信息
– 通过向 NN 发送心跳保持与其联系( 3 秒一次),如果 NN 10 分钟没有收到 DN 的心跳,则认为其已经 lost ,并 copy 其上的 block 到其它 DN
SecondryNode
辅助 NameNode 定期合并 fsimage 和 edits -> new fsimage
收起