银行Hadoop 数据仓库数据中台

为了保证时效性，实时数仓的数据存储技术应该如何选择？

银行业一般会用实时数仓做风控类相关业务，对于数据查询的时效性要求较高。现有的hive是无法满足快速返回查询要求的。那么请问业界是否有已落地的较好的解决方案？比如impala、presto或者使用MPP数据库？如果有，还望告知下大概的执行效率是如何的，满足了哪些业务需求，感激~另外，对...显示全部

关注8

参与24

提问者已获得满意解答

查看其它 6 个回答amu0722的回答

amu0722CEO打毛党

正巧我司正在构建实时数仓，做之前我们也是有一些确切场景的需求，而且很容易被“实时”、“数仓”这两个词搞混。
可以说下我们的想法，分解具体场景需求，而不是技术论需求。1.完全独立的场景比如实时监控类的指标，实时数据分析场景，这两个采用流式计算不落库的。2.需要与t-1与t+0场景结合指标数据，参考楼上几位回复即可。存储再查询肯定会在查的时候做聚合，时间上也不会节省太多。

生活生产服务其它 · 2020-08-09

查看赞同的人

rockcat
“实时”和“数仓”，的确是两个纠缠不清概念。
2020-08-13
赞同
评论

添加评论

为了保证时效性，实时数仓的数据存储技术应该如何选择？

查看其它 6 个回答amu0722的回答

回答者

amu0722 最近回答过的问题

回答状态