大数据分析
大数据分析
该主题还没有描述

问题

保险Hadoop·2020-02-26
呱呱爱吃瓜 · 银行 擅长领域:大数据, 服务器, 数据库
(1)、 combiner 有时一个 map 可能会产生大量的输出, combiner 的作用是在 map 端对输出先做一次合并,以减少网络传输到 reducer 的数量。 注意: mapper 的输出为 combiner 的输入, reducer 的输入为 combiner 的输出。(2)、 partition 把 map 任务输出的中间结果按...
银行Hadoop·2020-05-09
zftang · 小白一枚 擅长领域:数据库, 云计算, 服务器
64 会员关注
肯定可以的哇
保险节点·2020-02-06
呱呱爱吃瓜 · 银行 擅长领域:大数据, 服务器, 数据库
一个节点上运行的任务数目主要由两个因素决定,一个是 NodeManager 可使用的资源总量,一个是单个任务的资源需求量,比如一个 NodeManager 上可用资源为 8 GB 内存, 8 cpu ,单个任务资源需求量为 1 GB 内存, 1cpu ,则该节点最多运行 8 个任务。NodeManager 上可用资源是由管理员在...
能源采矿大数据分析·2020-04-02
zhuqibs · Adidas 擅长领域:云计算, 服务器, 存储
58 会员关注
(1)人的生命是有限的,技术是无限的,所以,不能什么都学,这一点是最主要的。(2)学习主流的技术,忽略杂牌的,如何区别呢, 看github的star和commit(3)如果是架构,先学数据库,再学大数据。数据库比较基础,有点概念和大数据向通。(4)如果是分析,先学传统的分析软件(saas、spss,obiee),再学大数据分析(h...
保险Hadoop·2020-03-05
Luga Lee · None 擅长领域:云计算, 容器, 容器云
46 会员关注
关键点还在于“NameNode”。 目录/文件和Block均会占用NameNode内存空间,大量小文件会降低内存使用效率,除此,小文件的读写性能远远低于大文件的读写,主要原因对小文件读写需要在多个数据源切换,严重影响性能。...
保险Hadoop·2020-02-06
youki2008 · DDT 擅长领域:服务器, 云计算, 数据库
256 会员关注
你这里描述的使用场景是k8s?还是Openstack或其他平台?
系统集成spark·2021-12-24
奔跑的蜗牛 · 武汉家事易农业科技有限公司 擅长领域:数据库, 云计算, 服务器
62 会员关注
不能,这个是要分应用场景的
系统集成大数据平台·2021-12-24
奔跑的蜗牛 · 武汉家事易农业科技有限公司 擅长领域:数据库, 云计算, 服务器
62 会员关注
Spark 文件 切分 规则同时 spark 也要判断 数据 大小是否大于切片大小的11倍如果大于才按切片大小进行切分
保险Hadoop·2020-02-26
尘世随缘 · 上海某互联网金融公司 擅长领域:云计算, 云原生, 微服务
86 会员关注
简单理解dataNode就是存储数据的服务。对应的NameNode是管理数据的服务(记录数据在哪个分片,当前副本情况),以及NodeManager是管理当前节点的服务
X社区推广
  • 提问题