1 ) NameNode 它是 hadoop 中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问,保存有 metadate 。
2 ) SecondaryNameNode 它不是 namenode 的冗余守护进程,而是提供周期检查点和清理任务。帮助 NN 合并 editslog ,减少 NN 启动时间。
3 ) DataNode 它负责管理连接到节点的存储(一个集群中可以有多个节点)。每个存储数据的节点运行一个 datanode 守护进程。
4 ) ResourceManager ( JobTracker ) JobTracker 负责调度 DataNode 上的工作。每个 DataNode 有一个 TaskTracker ,它们执行实际工作。
5 ) NodeManager ( TaskTracker )执行任务
6 ) DFSZKFailoverController 高可用时它负责监控 NN 的状态,并及时的把状态信息写入 ZK 。它通过一个独立线 0 程周期性的调用 NN 上的一个特定接口来获取 NN 的健康状态。 FC 也有选择谁作为 Active NN 的权利,因为最多只有两个节点,目前选择策略还比较简单(先到先得,轮换)。
7 ) JournalNode 高可用情况下存放 namenode 的 editlog 文件 .
收起