一般企业应用很少会介入核心组件的改造或优化工作,因为一方面是技术能力制约另外还有与开源社区后续版本的兼容性问题。排除掉自行研发或改造,剩下的关键问题就是组件选型。其实无论是CDH/HDP还是国内的几个发行商,都是基于开源社区的组件进行集成,所选取的范围有区别,这个要根据企业的自身需要进行衡量,但从功能上看总体差别也不是太大。更重要的是技术服务能力的评估,个人感觉目前大数据厂商的支持能力相对传统厂商在成熟度上还是要差些,企业自身或集成商要具备较强的能力,这个要有心理准备。此外如果进行了定制化的改造,要考虑产品厂商是否有能力将其推入社区或持续跟进,目前国内厂商对开源社区的影响力还是小些。
至于选择开源的方式,如果技术力量允许也不是不可行,但对一般企业我觉得不太推荐.
收起