关于银行的影像内容管理平台选型,是传统的Filenet&Oracle/DB2架构,还是分布式文档数据库,还是基于Hadoop的大数据平台?
银行IT从业人员都非常熟悉影像平台这个系统,它是为开户、理财、票据、信贷等业务系统提供非结构化&半结构化影像数据存取的平台,传统都以IBM的Filenet&关系型数据库为基本架构,
但是随着影像数据的快速膨胀,这些数据再次读取的效率明显下降,主要原因在于文件树的存储架构和数据量级的不匹配,另外结构化信息和非结构化信息分离的架构也导致了数据安全性及存取复杂度的提高。
另外企业也为此需要付出更多的NAS存储空间成本。因此大家开始探寻一条新的路子,大家开始关注文档数据库,比如以MongoDB为基础的各类产品;也有人开始关注大数据平台,例如以hadoop为基础的各类产品。部分企业早已开始了尝试。那么,从以下几个维度来看,这几种架构哪一个更适合金融企业呢?
谈一些个人看法:
从业务角度来看,多个业务流程,多中类型交易都离不开影像平台,属于关键业务节点,可靠性可用性的优先级较高。
从架构方案角度来看,传统架构中的非结构化数据与其元数据是分开存储管理的,而后端如果采用NAS存储的方式,有一定的性能瓶颈,扩展能力较弱。但这种架构灵活性还是可以的,后端存储方案可以根据实际情况来优化,应用层的改造较少,采用对象存储来做扩展也是可以的,由于都是采用的很成熟的方案,平台整体的稳定性和可靠性都较好;而新的架构实现的是统一管理,毫无疑问需要重构应用的数据持久层逻辑,分布式的扩展能力较强,引入新架构及其内部复杂的组件会带来运维的复杂度。
从技术自主创新角度来看,采用新架构的可行性较高,也是很好的尝试,方案成本有优势,也利于技术队伍培养。