主成分分析: 分析感染人群中,为什么会感染,感染的主因;分类算法: 按感染渠道、病症轻重,对所有感染人群进行分类;聚类算法: 按感染的地区,年龄,对所有感染人群进行聚类;线性回归和非线性回归: 对未来的感染人群数量进行预测;决策树: 分析有哪些症状的最有可能是患病人群;相似算法:评...
大数据平台的运维监控主要包括硬件和软件层面,具体如下:1、主机、网络、硬盘、内存、CPU等资源。在拥有几十台以上的集群环境中,大量的数据计算对硬件尤其是硬盘的损耗是较大的,在大量计算中,网络也往往会成为一个瓶颈,这些都需要时刻关注。2、平台层面主要监控平台各个组件的...
Hadoop组件包括HIVE\HDFS\Hbase\HUE\sqoop\spark\zooie\ES\等进行进行,可以通过Cloudera的 manager来实现对组件的运行和监控和异常告警cloudera manager有四大功能: (1)管理:对集群进行管理,如添加、删除节点等操作。 (2)监控:监控集群的健康情况,对设置的各种指标和系统运...