大数据平台的源数据格式一般用什么类型的哪?文本文件吗?那各个源系统的数据采集策略如何规划哪?例如实时性大概什么样子的哪?
你的问题要想回答很细会很长,但是概况一下就是源数据用什么类型不外呼文本文件,消息中间件,数据库采集策略如何规划每个公司不同,也就是打点的规则不同,有嵌入应用中采集,有采用第三方js脚本采集,还有直接从webserver日志日文件中解析,实时性一般都是结合消息中间件来实现后面跟一个流式处理框架比如storm spark streaming等
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30