hadoop平台有大量组件,从数据压入开始,模型处理,数据汇聚,数据输出,各个层面如何进行技术选型,构建起完整的大数据数据流转框架。
没有完全规定的模式,我个人理解的有数据压入,如sqoop,flume等,模型处理我理解成就是数据清洗这个一步方法多种多样考虑到后面还有数据汇总跟数据输出, 如果是规范性输入比如a|b|c等通过制定分隔符进行分割的,可以考虑使用hive,
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30