大数据分析 - 主题 - twt企业IT交流平台

问题
热度排序 时间排序

保险Hadoop·2020-02-26

(1)、 combiner 有时一个 map 可能会产生大量的输出， combiner 的作用是在 map 端对输出先做一次合并，以减少网络传输到 reducer 的数量。注意： mapper 的输出为 combiner 的输入， reducer 的输入为 combiner 的输出。(2)、 partition 把 map 任务输出的中间结果按...

赞同

回答1

关注2

银行Hadoop·2020-05-09

Hadoop集群去掉几个节点，是否还可以继续正常使用？

zftang · 小白一枚　擅长领域：数据库, 云计算, 服务器

64 会员关注

肯定可以的哇

赞同

回答1

关注2

保险节点·2020-02-06

Hadoop 某节点上任务数目太多，资源利用率太高，怎么控制一个节点上的任务数目?

呱呱爱吃瓜 · 银行　擅长领域：大数据, 服务器, 数据库

一个节点上运行的任务数目主要由两个因素决定，一个是 NodeManager 可使用的资源总量，一个是单个任务的资源需求量，比如一个 NodeManager 上可用资源为 8 GB 内存， 8 cpu ，单个任务资源需求量为 1 GB 内存， 1cpu ，则该节点最多运行 8 个任务。NodeManager 上可用资源是由管理员在...

赞同

回答1

关注2

能源采矿大数据分析·2020-04-02

因工作需要向大数据分析方面倾斜，学习有点盲目，无从下手，零基础的人如何快速进入正轨？专家给些建议资料？

zhuqibs · Adidas　擅长领域：云计算, 服务器, 存储

58 会员关注

（1）人的生命是有限的，技术是无限的，所以，不能什么都学，这一点是最主要的。（2）学习主流的技术，忽略杂牌的，如何区别呢，看github的star和commit（3）如果是架构，先学数据库，再学大数据。数据库比较基础，有点概念和大数据向通。（4）如果是分析，先学传统的分析软件（saas、spss，obiee），再学大数据分析（h...

赞同7

回答1

关注2

软件开发Docker·2021-12-02

请问docker和k8s是否面向应用呢？能否动态部署hadoop等分布式集群呢？

回答1

关注2

保险Hadoop·2020-03-05

为什么Hadoop适用于大型数据集的应用程序，而不是具有大量的小文件的应用程序？