在搭建环境之前要做好调研:1.大概的访问用户是多少 2.大概会存放哪些文件 3.文件存放规划目录要考虑哪些文件会成为访问热点等,另外你提到集群的机器性能不同,你要考虑hadoop本身特性namenode主要是做元数据管理跟用户跟datanode打交道经常用到查询如果信息尽量...
显示全部在搭建环境之前要做好调研:1.大概的访问用户是多少 2.大概会存放哪些文件 3.文件存放规划目录要考虑哪些文件会成为访问热点等,另外你提到集群的机器性能不同,你要考虑hadoop本身特性namenode主要是做元数据管理跟用户跟datanode打交道经常用到查询如果信息尽量保存到内存中速度就会有所提高所以选一个内存高一点的机器, datanode主要是io即数据的读写与传输其次是cpu因为hdfs文件如果进行压缩或者解压性能如何主要靠CPU了
收起