humidy

humidy

信息分析/架构师某公司

Do It ，Do Best！

回答

电信运营商数据库
回答于 · 2016-04-19

Hadoop的文件系统探讨

貌似进程比我们想象中的块，Cloudera在极力的推kudu，本周三的Cloudera上海分会还会重点分析讲解Kudu的生产使用。去学习下，然后再跟大家分享！

赞同2
电信运营商大数据 Hadoop
回答于 · 2016-04-19

在实施Hadoop项目的时候，最大的担心和顾虑是什么？

我觉得首先是架构方面，你引入开源大数据技术的动力需要明确，这建立在你对现有的IT系统的熟悉基础上。另外，你需要对大数据技术有一定的了解，有一支相关的队伍。可以帮助你弥补和延长现有系统的短板和现有资产的保值，最后你

赞同1
电信运营商 Hadoop 监控告警
回答于 · 2016-04-19

对于监控告警等平台，使用原生Hadoop的公司如何解决？

我觉得几个层面，主机和资源层面，我们可以利用成熟的集群监控软件，如ganglia、对Hadoop的监控可以通过JMX、API等。也可以通过其不同组件提供的RESTFull API。但最好的方式是将这些东西结合形成一个平台，如果可以选择，开源

赞同1
电信运营商数据库 Hadoop企业软件栈
回答于 · 2016-04-18

Hadoop企业软件栈

恩，我也认为一个企业级的平台需要满足批处理、实时计算、交互式计算这几个特性，所以基于这几个特性可以根据不同的组件来组合，从采集到存储到资源分配到计算引擎到模型设计和展现这些层次来设计！

赞同1
互联网服务数据库
回答于 · 2016-04-18

hadoop资源分布问题

如果是1.0的版本，数据分配不均，每天可以手动通过数据平衡命令来实现数据平衡，资源，因为1.0主要是分配map和reduce的槽位slot，所以根据硬件不一样，更改slot数目可以缓解不平衡的影响。如果是在2.0在yarn中，我们可以更改配置文

赞同
互联网服务数据库
回答于 · 2016-04-15

hadoop资源分布问题

现在Hadoop集群都是基于YARN或MESOS来管理，在这个基础上我们可以根据集群的硬件情况分配不同的适当容器，在此基础上可以使用Docker来做容器管理，控制集群的整体资源！目前Hadoop的YARN在资源这块已经做了很多的改进其中的C

赞同3
医药高效存储大数据生命周期管理数据架构体系
回答于 · 2015-12-09

如何构建合理的数据架构体系、实现数据的高效存储及利用？

传统的数据架构是以数据仓库为中心，形成数据采集->数据整合->数据展现->数据挖掘。大数据时代以Hadoop为代表的大数据技术很好的将数据仓库进行了保值扩容，基于其上形成了一个新的生态圈。随着实时计算和离线

赞同
银行大数据分析系统日志分析
回答于 · 2015-12-09

如何应用大数据在系统日志或者数据库日志方面做一些分析和挖掘。

我们做的项目是Logstash代理收集数据，然后数据进入Redis列表，然后进入Storm然后用Elastic Search进行索引，最后用Kubana进行展现。其中还用到Cassandra进行索引的存储

赞同4
互联网服务大数据生命周期大数据生命周期管理
回答于 · 2015-12-09

大数据的生命周期如何管理及利用？

对于数据的生命周期，我们一般会将数据分为冷数据，温数据和热数据。对于不同的数据我们采用的处理方式不同。冷数据我们一般会归档压缩存储，温数据我们会使用读写IO低的便宜存储(SAS或SATA)存储，热数据我们会使用SSD或高端

赞同
银行实时数据分析大数据采集
回答于 · 2015-12-09

大数据对于实时数据的分析，如果需要采集实时数据，如何采集？

对于事实数据分析，我们通常会采用流处理技术，对于流处理技术，实时采集方面(如实时生成的日志)我们可以用Flume，对于RDBMS我们可以使用ogg和数据库的触发器以及增量更新，采集玩的数据可以进入kafka的消息队列，来进行消息的分

赞同

关于 humidy

用户名： humidy
职位：信息分析/架构师
公司：某公司
行业：电信运营商
地点：杭州
社区声望：459
荣誉等级：0

关注TA的人

更多关注TA的人 >>

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广