实时数据流平台
实时数据流平台
实时数据流平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Flink和Beam),以及数据实时存储(如列族存储的HBase)。
实时数据流平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Flink和Beam),以及数据实时存储(如列族存储的HBase)。

热点

kafka·2018-11-23
平台人生 · 平台人生 擅长领域:服务器, 数据库, 关系型数据库
83 会员关注
今天给大家介绍一个强大的开源流处理平台——Kafka--Kafka是什么?ApacheKafka是一个分布式发布-订阅(Pub-Sub)消息系统和一个强大的队列,可以处理大量的数据,能够将消息从一个端点传递到另一个端点。它的消息保留在磁盘上,并会在群集内复制以防止数据丢失。此外,Kafka需要构建...(more)
专栏: 平台人生
浏览5605
评论1
kafka·2018-10-31
yinxin · 某金融机构 擅长领域:数据库, 服务器, 云计算
976 会员关注
背景介绍Kafka简介Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下:以时间复杂度为O(1)的方式提供消息持久化能力,并保证即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条消息的传输支持Kafka...(more)
浏览1166
评论1
互联网服务大数据·2018-10-18
windix联盟成员 · 某证券公司 擅长领域:大数据, 数据库, 大数据平台
379 会员关注
Kafka可保证在同一partition中的消息是有序的,producer把数据按照同一主键发到同一个partition即可。
人工智能·2018-05-03
windix联盟成员 · 某证券公司 擅长领域:大数据, 数据库, 大数据平台
379 会员关注
一、券商实施个性化推荐项目的必要性1.1个性化推荐技术发展背景目前,随着用户接收到的信息量爆炸般增长,传统的推荐以及服务方式的边际收益正在不断减少,用户个性化的需求变得越来越多。大数据实时个性化服务,主要基于大数据用户画像、产品画像建设成果,结合实时流计算框架,以...(more)
专栏: 最佳实践
浏览13175
评论4
IT其它kafka·2018-03-01
Luga Lee · None 擅长领域:云计算, 容器, 容器云
43 会员关注
若没有特殊定义的话,日志应该在运行脚本kafka_run_class.sh中定义
elasticsearch·2017-10-19
Judy朱 · 交银康联 擅长领域:云计算, 服务器, 大数据
4 会员关注
本文要给大家分享的是我们如何去构建一个日志系统、用到了那些技术、为什么用这些技术,同时会讲述这个过程中遇到的问题及优化方法,希望能给你在实践中能够提供一些参考。前言最近在维护一个有关于日志的项目,这个项目是负责收集、处理、存储、查询京东卖家相关操作的日志,我...(more)
浏览2117
kafka·2017-10-16
哈杜普 · 百度 擅长领域:大数据, 大数据处理, 数据库
30 会员关注
收藏3
评价2
金币5
Redis·2017-10-16
该来的总会来 · 华润 擅长领域:大数据, 分布式系统, 服务器
119 会员关注
1.为什么添加Streams数据流?Stream数据流的使用越来越多,Redis的作者antirez也在积极思考,如何让redis能够很好的支持数据流的使用场景。antirez认为Redis现有的数据结构都不能很好的处理数据流,例如:(1)Sortedsets有序集合中的元素根据他们的分值进行变化,不能自然的模拟不断被...(more)
浏览1572
开源·2017-10-11
姜沫 · 鞋盒新能源 擅长领域:服务器, 存储, 主机
60 会员关注
作者|HaohuiMai,BillLiu,NaveenCherukuri译者|核子可乐Uber公司通过传播各类实时来源数据以实现更加无缝化且令人愉悦的用户体验。具体而言,Uber需要交付UberEATS订单的预估交付时间(简称ETD)、结合即时交通条件得出的指导配送路线以及其间各项重要影响指标。来自Uber的几位优...(more)
浏览4764
kafka·2017-10-10
James_Liu · AXA 擅长领域:数据库, 关系型数据库, 数据库系统改造
132 会员关注
Kafka起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、Spark等都支持与Kafka集成。1概述Kafka与传统消息系统相比,有以下不同:它被设...(more)
浏览1778

描述

实时数据流平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Flink和Beam),以及数据实时存储(如列族存储的HBase)。
实时数据流平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Flink和Beam),以及数据实时存储(如列族存储的HBase)。
X社区推广
  • 提问题