查看其它 1 个回答windix的回答

windixwindix联盟成员商业分析师某证券公司

大数据系统分为硬件系统和大数据组件。硬件系统一般为X86服务器,供应商的可选范围很广,参考配置如下。

用途型号处理器内存硬盘RAID操作系统
Hadoop Name NodeX3650 M5Intel Xeon E5-2600 v3 18C144G14*TRAID 5Red Hat Enterprise Linux 6.5
Hadoop Data NodeX3650 M5Intel Xeon E5-2600 v3 18C144G14*2TNO RAIDRed Hat Enterprise Linux 6.5
Spark CoreX3650 M5Intel Xeon E5-2620 v4 8C256G4*1.2TRAID 5Red Hat Enterprise Linux 6.8
Spark StreamingX3650 M5Intel Xeon E5-2620 v4 8C256G4*1.2TRAID 5Red Hat Enterprise Linux 6.8
ElasticsearchX3650 M5Intel Xeon E5-2630 v3 8C128G4*1.2TRAID 5Red Hat Enterprise Linux 6.8
RedisX3650 M5Intel Xeon E5-2620 v4 8C256G4*960GRAID 5Red Hat Enterprise Linux 6.8
KakfaX3650 M5Intel Xeon E5-2620 v4 8C64G4*960GRAID 5Red Hat Enterprise Linux 6.8
Olap服务器X3650 M5Intel Xeon E5-2630 v4 10C256G4*1.2TRAID 5Red Hat Enterprise Linux 6.8
报表服务器X3650 M5Intel Xeon E5-2640 v4 16C128G4*600GRAID 5Red Hat Enterprise Linux 7
ETL服务器X3650 M5Intel Xeon E5-2620 v2 16C256G4*960GRAID 5Red Hat Enterprise Linux 6.8

大数据组件可选择开源发行版或第三方商用发行版。
(1)开源发行版以Hadoop系统为核心,包含HDFS、Yarn、Zookeeper、Hive、Hbase、Sqoop、Impala、ElasticSearch、Spark等,可以按需求自行安装。开源发行版的优点在于完全开源免费以及公开的文档和资料比较丰富。缺点在于:
·版本管理复杂。各种版本层出不穷,依赖关系不清,难以升级运维。
·集群部署、安装、配置复杂。大量的集群配置文件需要分发到每一个节点上,容易出错,效率低下。
·集群运维复杂。对集群的监控、运维依赖第三方的其他软件,难度较大。
(2)国内和国外厂商提供易于使用的第三方发行版甚至一体化解决方案。国外著名的大数据平台供应商包括Cloudera、Hortonorks等。国内知名供应商包括华为、星环等。主流第三方发行版对比如下。
9sqjz7uzg5v

9sqjz7uzg5v

shh8s6z3x5
shh8s6z3x5

z7q6wro5o4
z7q6wro5o4

互联网服务 · 2019-06-19
浏览2441

回答者

windix
商业分析师某证券公司
擅长领域: 大数据数据库大数据平台

windix 最近回答过的问题

回答状态

  • 发布时间:2019-06-19
  • 关注会员:4 人
  • 回答浏览:2441
  • X社区推广