1.yarn的单点问题cloudera已经在解决中,譬如CDH5-beta版本已加入HA的支持。如果着急的话可以考虑,如果不着急的话猜想很快就会出正式版。
2.HIVE用于离线的查询,一般可用性没有哪些必须,如果你要实现也比较容易,前面挡一个haproxy,后面挂多台hive就可以实现。
3.hbase的hmaster是有高可用解决方案的,你搜一下就知道了。
4.备份hive的原数据使用简单的MySQL就可以,不用那么复杂。
5.zookeeper最佳节点数是5台。从你目前的情况来看3台已经可以。
6.如果想安全不光这些,还需要备份hdfs里面的数据。
7.不明白意思。是指什么。