在现有的Hadoop现状中,想实现无缝升级是个难点,升级过程中有些内容需要你注意一下:1. 在升级需求强烈的情况下,先统计你的Hadoop现有的业务实现的耦合度。以及业务实现中的一些扩展点在下一版本的容错性。2.在涉及升级过程中一些重点服务的数据保证一致性,尤为需要注意HBase中...
显示全部在现有的Hadoop现状中,想实现无缝升级是个难点,升级过程中有些内容需要你注意一下:
1. 在升级需求强烈的情况下,先统计你的Hadoop现有的业务实现的耦合度。以及业务实现中的一些扩展点在下一版本的容错性。
2.在涉及升级过程中一些重点服务的数据保证一致性,尤为需要注意HBase中的数据。
3.在yarn版本之后的资源划分比较方便,其自身fair的资源调度也很完整,可以按不同客户和业务线去细化你的资源边界,
4.关于计费部分可以考虑统计每个用户在集群中的使用情况,例如内存,硬盘,CPU,带宽等情况设计收费细则,这些可以参考阿里云的收费模式。
总结:在升级过程中很难实现对现有业务不影响的方案,但是对于离线分析来说几小时的延迟还是可以接受的,重点是了解你现有集群的一些业务。
收起