1、首次用Hadoop生态圈内的各个组件,最困难的是使用模式的转变,不像SQL一统天下的传统数据看那么容易上手。2、面对分布式引擎,遇到问题没有办法排查,因为你根本不知道你的程序在那里执行以及执行到哪里了,不像单机程序,到日志目录下看日志。3、遇到组件报错无从下手解决,只能不...
显示全部1、首次用Hadoop生态圈内的各个组件,最困难的是使用模式的转变,不像SQL一统天下的传统数据看那么容易上手。
2、面对分布式引擎,遇到问题没有办法排查,因为你根本不知道你的程序在那里执行以及执行到哪里了,不像单机程序,到日志目录下看日志。
3、遇到组件报错无从下手解决,只能不断地查资料,最困扰的是没法用谷歌,某度又搜不出来,尤其是四五年前尤其明显,现在情况已经好些了。
收起