回复 macrozeng hadoop是一个离线统计分析工具,不能算一个数据库系统。 最大的不同是,一个是离线计算,一个是记录关系。
回复 sgphappy2007 选择稳定版本。 如果计划长期使用,并且有一定的掌控力度,可以考虑使用社区版,自己根据兼容性组装。如果想买服务或技术支持,可以考虑cloudra/hortworks.版本,目前国内使用cdh比较多。
回复 pingley 自动化运维就做两个事情:1.命令编排。2.配置管理。 建议使用一些开源的工具,例如:puppet, saltstack等工具来做配置文件的管理和批量机器的操作。
回复 月光无寒 有差异,据说原生的java性能好很多,效率高很多。具体没有做过测试。
回复 月光无寒 推荐系统有使用hadoop做用户画像,配合流式计算做实时的个性化推荐。
回复 月光无寒 没有使用。
回复 codeyunwei 保持开放的心态去学习。 从学习hadoop的实现原理开始,然后学习其代码的具体实现,从中可以学习到分布式系统的设计思想。 利于我们熟悉分布式系统的整体设计,以及大数据在技术方面的处理理念,譬如:大
回复 cloudsher 简单的来说,spark是使用内存的hadoop,让数据运算速度更快。 spark底层也是使用的mr,需要了解Hadoop,并且spark也是基于hadoop上的产品,学习建议从hadoop学起。
回复 zyt 1.应用场景比较广泛,对人们如何更好利用数据去驱动产品的发展,以及企业的管理。 2.hadoop是一个开源产品,都可以使用它,简化来数据处理的难度。未来会朝快数据和在线上发展。3.首先熟悉原理,多读源码,并参与与
回复 huangluqin87 要看用什么维度。张三,李四,王五。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30