美国队长

美国队长

研发工程师Alibaba

动态

2019-08-30 · 回答了问题

hadoop+spark 集群环境资源预估？

可以先结合具体的业务场景，将数据按照时效性进行分类，如实时、准实时、离线，实时的数据从数据量层面去衡量内存的分配，CPU即线程数等，同时从成本上考虑对现有的数据进行压缩存放，具体的压缩策略可以结合具体场景衡量...

赞同
2019-07-30 · 回答了问题

ambari的HADOOP集群，下SPARK2 HIVE HBASE等组件整合问题，类找不到？

这个应该是版本的原因造成的，建议你到官网参照你是用的版本，然后根据错误提示guava版本看一下，版本号是否一致

赞同 4
2017-09-29 · 回答了问题

问下页面发送请求，然后分布式计算再把结果返回给请求端，这个可以用spark实现吗？

可以，用spark他也有支持应用层基级别的调用，比如spark sql等

赞同 6
2017-09-18 · 回答了问题

基于hbase的用电信息采集系统如何设计？

hbase应该是被你用来做信息存储，基于hbase特性跟电力业务，你可以这样思考：你的采集信息是否可以从时间>地域>小区>个人等范围逐渐缩小的方式进行排列,主要了考虑hbase的region个数确认这样可以避免某个regionse...

赞同 6
2017-08-09 · 回答了问题

Hadoop格式化时报错？

从问题来看是你的Class版本问题，可以从下面几个方面入手1.你之前有没有格式化过，如果有就把之前的指定元数据路径给删了当然这是建立在没有数据需要备份的情况2.你能否贴一下你的格式化界面打印的完整日志3.你的hadoop...

赞同 3
2017-08-01 · 回答了问题

超大数据库的在线迁移问题？

采用增量同步的方式，可以避免影响现在线上的应用，当然这也跟数据库有关，mysql可以用binlog进行sql重新执行。其他的数据库可以考虑用阿里的datax进行数据迁移，速度很快，他的内部采用ring buffer机制，所以比一般的采用jdbc来...

赞同 3
2017-07-31 · 发布了新文章

Hadoop入门及常见应用问题探讨

专栏：活动总结

评论0

赞 1
2017-07-27 · 回答了问题

大家都是在什么业务场景下使用的hadoop等大数据产品？

数据量比较大，对数据处理的时效性有要求

赞同
2017-07-27 · 回答了问题

如何学习hadoop？

市面上再好的教材也没有自己动手去写，我建议你看学习视频，然后找例子去模仿，然后去了解例子的代码意思，循环迭代，就会进入角色

赞同
2017-07-27 · 回答了问题

大家都是在什么机缘巧合下接触的hadoop等大数据产品？

我第一次写Mapreduce也就是接触大数据的时候，是在华为给xx移动公司统计一下用户的消费金额通话时间等，不是很大的数据量是没有必要使用大数据相关的框架...

赞同

关于美国队长

用户名：美国队长
职位：研发工程师
公司： Alibaba
行业：互联网服务
社区声望：2162
荣誉等级：0

关注TA的人

更多关注TA的人 >>

最近来访

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024 talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广