Hadoop - 主题 - twt企业IT交流平台

互联网行业，大多是走hadoop／spark／storm／EK流。MPP和Hadoop，罗列如下几点，可供选型参考： MPPHadoop数据规模TB级PB级扩展能力较低，单集群规模一般在100-节点较高，单集群规模可达4k-5k节点复杂查询分析性能较高较低响应实时性较高较低数据类型结构化结构化＋非结构化开发门槛低，基于SQ...

赞同3

回答2

关注4

系统集成多租户·2017-07-04

在企业大数据架构中，除了采用Kerberos和CDH多租户以外，还有哪些较好的权限和资源控制产品呢？

heraleign · iwhalecloud　擅长领域：大数据, 大数据平台, 服务器

130 会员关注

暂时只讨论第一个话题，内存计算和仓库计算我再单独提问，带来不便，还请谅解，谢谢！

赞同2

回答2

关注3

互联网服务数据备份·2017-06-27

全球Hadoop服务器因配置不安全导致大量数据泄漏，针对这种情况该如何进行防范和补救？

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

首先最基本的查看hadoop自带默认的一些监听端口，比如50070,10020等一般配置在hdfs-site.xml，mapred-site.xml，yarn-site.xml这几个文件中，修改成另外的端口，另外对hadoop集群的访问要设置ip过滤等措施其次是hadoop的job权限分为三层，一个是Servicelevel，就是控制所有用户对job的...

证券数据源·2017-06-21

rein07 · 某证券　擅长领域：人工智能, 大数据, 机器学习

586 会员关注

数据源都来自企业内部的众多系统。首先还是要看对数据有什么样的期望，毕竟技术只是实现的手段。

赞同

回答1

关注2

互联网服务spark·2017-06-20

请教spark on hive的安装问题

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

题目应该是hive on spark 另外你这个异常可能是hive跟spark的版本不一致的原因，建议你看一下你的hive源码中的pom.xml里面依赖的spark是什么版本的

电信运营商大数据·2017-06-13

bryan · 金融研发　擅长领域：云计算, 容器, 容器云

335 会员关注

数据的生命周期和业务紧密相关，是业务属性，比如有的业务要求保存5年，有的业务要求保存3年。我们在做的过程中，生命周期是自行研发工具进行管理的。可以参考一下这个文章 https://talena-inc.com/media/Talena_Report_HadoopAdoption_2015.pdf...

赞同5

回答1

关注2

问题
热度排序 时间排序

描述

主题组织结构热门关系主题

问题热度排序时间排序

描述

主题组织结构热门关系主题

问题
热度排序时间排序