Hadoop是新兴的开源分析平台, 新兴决定了它有一定的优势: 比如灵活的计算框架, 数据规模,非结构化,横向扩展能力等等; 但是也有其缺点: 发展处于初期, 技术框架架构等稳定性低, 从1.0到2.0的变化如此之大就可以看出, Hadoop还在不断地创新, 还需要很长一段时...
显示全部
Hadoop是新兴的开源分析平台, 新兴决定了它有一定的优势: 比如灵活的计算框架, 数据规模,非结构化,横向扩展能力等等; 但是也有其缺点: 发展处于初期, 技术框架架构等稳定性低, 从1.0到2.0的变化如此之大就可以看出, Hadoop还在不断地创新, 还需要很长一段时间步入成熟期, 因此很难让传统的大客户将海量数据完全放心低放到Hadoop中, 但是尝试Hadoop带来的创新目前很多.
因此目前企业级数据库仓库还是以商业产品为主, 比如IBM的DB2 BLU, BCU等为主, 新兴互联网行业多采用Hadoop中Hive, Impala等作为数据挖掘的工具, 数据的存储则采用NoSQL数据库(如Hbase)和分布式文件系统(HDFS,GPFS-FPO)为主.
收起