电信运营商的业务数据里结构化数据比较多,随着大数据项目的建设,现在已经有需求要将部分结构化数据存储到大数据平台,并提供查询和分析功能,而且还有关系型数据库和大数据平台之间的数据同步需求,针对这种需求,hadoop生态中应该怎样规划?
首先hadoop对于小批量的数据查询并没有优势,所以对于大批数据处理还是放在hadoop中,关系型数据库对简单的查询还是可以的,所以我的建议是利用hadoop对大数据进行处理,然后处理结果同步到关系型数据库如oracle或者mysql,数据同步用阿里的开源神器Datax
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30