hadoop哪些组件可实现准实时数据处理,目前主流使用的是哪些?

hadoop哪些组件可实现准实时数据处理,目前主流使用的是哪些,具体如何实现显示全部

hadoop哪些组件可实现准实时数据处理,目前主流使用的是哪些,具体如何实现

收起
参与10

查看其它 2 个回答shaofengshi的回答

shaofengshishaofengshi系统架构师上海跬智

通常实时数据处理采用像 storm、flink、spark streaming 这些方式进行处理,然后存储到 hbase、hdfs 等地方。使用这些技术的特点是需要针对自己的情况开发程序,然后部署、调试、监控,非常复杂,也是一般企业比较难掌握的。

Apache Kylin 是一个流行的大数据在线分析(OLAP)引擎,是第一个由国人开发并贡献到 Apache 基金会的开源项目,在国内有众多用户。Kylin 的特点是,无需编程,用户通过图形化界面进行建模,然后 Kylin 自动生成 Hadoop/spark 任务,对数据进行聚合、编码、索引,最后存储到 HBase 中;查询的时候使用 SQL 就可以了,支持很多 SQL 分析工具如 Tableau 等等。Kylin 已经在美团、滴滴、ebay 等大企业得到大规模使用,足见其吸引力。

在过去的几年里,Kylin 从批处理逐渐向实时处理进化,3年前就发布了分钟级延迟的准实时方案,在携程等大规模使用;而且现在还在开发秒级延迟的完全实时方案,不久就会正式对外发布。企业可以使用 Apache Kylin 构建自己的大型数据仓库,同时支持历史和实时数据。

软件开发 · 2019-09-03
浏览1906

回答者

shaofengshi
系统架构师上海跬智
擅长领域: 分布式系统服务器数据库

shaofengshi 最近回答过的问题

回答状态

  • 发布时间:2019-09-03
  • 关注会员:4 人
  • 回答浏览:1906
  • X社区推广