大数据平台的数据采集用什么格式的哪?

大数据平台的源数据格式一般用什么类型的哪?文本文件吗?那各个源系统的数据采集策略如何规划哪?例如实时性大概什么样子的哪?显示全部

大数据平台的源数据格式一般用什么类型的哪?文本文件吗?
那各个源系统的数据采集策略如何规划哪?例如实时性大概什么样子的哪?

收起
参与16

查看其它 2 个回答美国队长的回答

美国队长美国队长研发工程师Alibaba

你的问题要想回答很细会很长,但是概况一下就是源数据用什么类型不外呼文本文件,消息中间件,数据库
采集策略如何规划每个公司不同,也就是打点的规则不同,有嵌入应用中采集,有采用第三方js脚本采集,还有直接从webserver日志日文件中解析,实时性一般都是结合消息中间件来实现后面跟一个流式处理框架比如storm spark streaming等

互联网服务 · 2017-07-07
浏览3868

回答者

美国队长
研发工程师Alibaba
擅长领域: 大数据大数据平台数据库

美国队长 最近回答过的问题

回答状态

  • 发布时间:2017-07-07
  • 关注会员:4 人
  • 回答浏览:3868
  • X社区推广