银行影像内容管理平台选型,是传统的Oracle/DB2架构,还是分布式文档数据库,还是基于Hadoop的大数据平台?

关于银行的影像内容管理平台选型,是传统的Filenet&Oracle/DB2架构,还是分布式文档数据库,还是基于Hadoop的大数据平台?银行IT从业人员都非常熟悉影像平台这个系统,它是为开户、理财、票据、信贷等业务系统提供非结构化&半结构化影像数据存取的平台,传统都以IBM的Filene...显示全部

关于银行的影像内容管理平台选型,是传统的Filenet&Oracle/DB2架构,还是分布式文档数据库,还是基于Hadoop的大数据平台?

银行IT从业人员都非常熟悉影像平台这个系统,它是为开户、理财、票据、信贷等业务系统提供非结构化&半结构化影像数据存取的平台,传统都以IBM的Filenet&关系型数据库为基本架构,
但是随着影像数据的快速膨胀,这些数据再次读取的效率明显下降,主要原因在于文件树的存储架构和数据量级的不匹配,另外结构化信息和非结构化信息分离的架构也导致了数据安全性及存取复杂度的提高。
另外企业也为此需要付出更多的NAS存储空间成本。因此大家开始探寻一条新的路子,大家开始关注文档数据库,比如以MongoDB为基础的各类产品;也有人开始关注大数据平台,例如以hadoop为基础的各类产品。部分企业早已开始了尝试。那么,从以下几个维度来看,这几种架构哪一个更适合金融企业呢?

  1. 投资成本维度。
  2. 平台可靠性维度。
  3. 横向扩展能力维度。
  4. 与银行应用衔接复杂程度的维度。
  5. 运维复杂度维度。
收起
参与89

查看其它 16 个回答haizdl的回答

haizdlhaizdl技术经理大连

银行的影像平台数据就目前来看,一般会存放票据系统、信贷系统、核心系统、理财业务等相关的票据、单据以及高拍仪采集的一些影像数据。一方面它具备结构化信息,即票据、影像本身抽出的标识信息,另外一方面是完全的非结构化影像数据。目前有两方面读写要求,一个是高速传输、并发写以及定期归档的要求;另外一方面需要根据结构化信息迅速找到非结构化信息以供信贷审核、票据审核、集中授权以及其他类的一些业务所用。因此兼有结构化信息以及非结构化信息,单一的关系型数据库或者hadoop平台是不太容易解决的。

文档数据库兼具存JSON以及非结构化数据的功能,可以通过键值方式实现在同一套平台当中实现快速检索,可以通过分布式架构实现横向扩展增加并发吞吐量,从数据存储特点契合度和读写性能角度分析,应该讲都是比较合理的选择。

但是也需要影像平台的应用层针对文档数据库的调用接口进行相应的改造,最起码得把数据写入和读取接口改掉。而且需要很长时间的磨合优化,毕竟IBM Filenet虽然不受待见,也在银行的影像平台当中占有绝对市场地位很多年了,必然有可圈可点的地方,这些地方是需要我们在新的平台当中逐渐寻找和优化的。

银行 · 2021-07-07
浏览5082

回答者

haizdl
haizdl101634
技术经理大连
擅长领域: 灾备存储服务器

haizdl 最近回答过的问题

回答状态

  • 发布时间:2021-07-07
  • 关注会员:22 人
  • 回答浏览:5082
  • X社区推广