实时数据仓库与传统数据仓库的融合:
1)实时数据仓库与历史数据仓库是否考虑统一建模还是分开建模?
2)实时数据仓库的实时数据与历史数据仓库的历史数据是统一存储还是分开存储?
数据要融合才能价值最大化,企业级数据仓库建设的一个主要目的也是实现企业业务数据的大集中。实时的数据信息有限,存量的数据信息丰富但时效性不足,二者结合才能构建更贴合实际及复杂的业务场景,避免数据利用的单一化及简单化。实时数据仓库与传统数据仓库在架构设计及模型设计上,应该做到统一规划和设计,避免在数据平台上出现竖井式的设计,譬如在数据仓库中规划一个实时数据区,目前基于hadoop架构的数据仓库中存在部分类似案例。虽然目前实时数据采集多集中交易流水,但业务应用的需求不止于此,例如,在客户的服务优化中,在客户拨打银行客服电话时,如果能实时捕获及分析客户的操作信息,结合客户的历史数据(传统T+1数据仓库中的客户签约、交易行为、资产负债等),探索实现客服电话的精准导流,而非冗长的语音提示。又如各行都在建设的秒批秒贷的在线信贷系统应用,如果要较好的实现风险监测,就需要考虑历史数据与实时数据的融合,比如与第三方合作的单一门店的流量监测,异常分析等。