大数据分析 - 主题 - twt企业IT交流平台

热点

Hadoop·2017-08-03

235 会员关注

NamenodeHA原理详解社区hadoop2.2.0release版本开始支持NameNode的HA，本文将详细描述NameNodeHA内部的设计与实现。为什么要NamenodeHA？NameNodeHighAvailability即高可用。NameNode很重要，挂掉会导致存储停止服务，无法进行数据的读写，基于此NameNode的计算（MR，Hive等）也无法完成...(more)

赞同4

生活生产服务其它spark·2019-04-10

关于Cognos能支持的商用spark版本，当然也可以考虑其他产品，欢迎大家推荐？

左右 · ex-IBM　擅长领域：大数据, 商业智能, 联机分析处理

27 会员关注

关注一下同时补充一些背景，这块我参与的比较深所以有一些观点刚好也借此机会跟同行们讨论一下。首先是BI层由于存在自主分析的需求，所以聚合结果或者临时表这种方式业务上不可行，客户常见的分析维度经过多轮筛选依旧在70+个，且个人认为随着产品更加扁平维度会以标签的形式扩...

大数据处理·2019-03-25

yinxin · 某金融机构　擅长领域：数据库, 服务器, 云计算

978 会员关注

大数据是收集、整理、处理大容量数据集，并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限，但这种计算类型的普遍性、规模，以及价值在最近几年才经历了大规模扩展。本文将介绍大数据系统一个最基本的组件：处理框架...(more)

赞同

大数据·2019-01-16

大数据时代背景下教育企业的精准化和个性化管理及服务实践常见问题

rein07 · 某证券　擅长领域：人工智能, 大数据, 机器学习

584 会员关注

大数据时代已经来临，教育行业作为社会大众共享的无形财富，其开放己成为数据整合和共享应用的前提条件。“十三五"期间有望形成和谐健康的行业生态。基础设施提供商、大数据服务商、数据挖掘与分析提供商、数据应用服务提供商、数据安全提供商、教育行政部门以及教育大数据...(more)

赞同3

专栏：活动总结

大数据·2019-01-02

大数据时代背景下企业的精准化和个性化管理及服务实践难点问题

sxtycxx · 人工智能（计算机视觉）　擅长领域：存储, 灾备, 服务器

520 会员关注

赞同3

专栏：活动总结

证券大数据·2018-12-25

大数据分析中针对日志分析的框架如何选型？

asdf-asdf · cloudstone　擅长领域：云计算, 服务器, 系统运维

364 会员关注

elk 常用组件, 上层业务封装还需要求其他组件完成日志分析 elk + redis + mysql 热点数据 , 热点分析等等, 看你的业务是什么模式和开发人员偏好

赞同3

回答3

关注4

银行大数据·2018-12-24

大数据中的实时计算SPark和Storm优缺点是什么？分别适合于哪些场景？

rein07 · 某证券　擅长领域：人工智能, 大数据, 机器学习

584 会员关注

SparkStreaming和Strom都属于实时计算框架，有点都是可以做到对数据的实时处理。SparkStreaming是基于Spark Core实现的，所以对数据的处理要形成RDD，暨要形成数据窗口，所以其处理过程可以称之为微批处理，而storm是可以做到实时处理每一条数据的，所以相对来说，实时性比sparkstream...

大数据·2018-12-17