回复 夏日毛毛雪 在Hadoop上产生的结果数据,会放到NoSQL或关系数据库上,用于展示或其他用途。
回复 beyondmch 是的。需要后续挖掘,hadoop仅仅是个工具。 是的,使用Hive或mr结合数据仓库来做。 是的。
回复 Lee_185216 hadoop的生态是指,他的一系列产品或叫组件功能,指的是hive, pig, flume, hbase等这些。 学习的目的是因为,这些东西需要配合使用,解决不同的问题,例如:hive简化Map reduce,HBase的支持在线存储等。。
回复 Lee_185216 spark基于hadoop。
回复 Lee_185216 新版mr就是yarn, yarn是可以替代mr的。yarn可以存到存储中,提高速度。
回复 zhenda 不是share nothing架构。如果一个节点出现问题,会通过它的其他副本,把数据迁移再到其他节点上。
回复 robinzyx 首先你需要把jobhistory服务起来。类似这样的命令: sbin/mr-jobhistory-daemon.sh start historyserver 然后在map-site.xml里面,把下面的mapreduce.jobhistory.address的value设置为0.0.0.0:10020
回复 robinzyx hdm1.wanwei.com:10020整个不通导致,查一下防火墙或网络,以及这台机器的服务是否启动。
回复 zhangsharp20 目前来说,hadoop的可扩展性更好一些,通过简单的增加机器,就可以增加datanode,人为干预的少很多。oracle才刚刚起步,以及关系的问题,目前处理不是很好。
大数据对银行的用途是:一个是用于提高用户体验,一个是各种决策支持,一个是信用体系建立。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30