银行的影像平台数据就目前来看,一般会存放票据系统、信贷系统、核心系统、理财业务等相关的票据、单据以及高拍仪采集的一些影像数据。一方面它具备结构化信息,即票据、影像本身抽出的标识信息,另外一方面是完全的非结构化影像数据。目前有两方面读写要求,一个是高速传输、并发写以及定期归档的要求;另外一方面需要根据结构化信息迅速找到非结构化信息以供信贷审核、票据审核、集中授权以及其他类的一些业务所用。因此兼有结构化信息以及非结构化信息,单一的关系型数据库或者hadoop平台是不太容易解决的。
文档数据库兼具存JSON以及非结构化数据的功能,可以通过键值方式实现在同一套平台当中实现快速检索,可以通过分布式架构实现横向扩展增加并发吞吐量,从数据存储特点契合度和读写性能角度分析,应该讲都是比较合理的选择。
但是也需要影像平台的应用层针对文档数据库的调用接口进行相应的改造,最起码得把数据写入和读取接口改掉。而且需要很长时间的磨合优化,毕竟IBM Filenet虽然不受待见,也在银行的影像平台当中占有绝对市场地位很多年了,必然有可圈可点的地方,这些地方是需要我们在新的平台当中逐渐寻找和优化的。