需要根据核心业务对存储形式的要求进行选择,当前主流存储厂商的存储都具备 SAN+NAS 特性,不存在结构化和非结构化选择问题,在存储选型之前要多了解各家存储 SAN+NAS 特性的实现方式。
收起银行系统建设过程中,通过数据建模,确定数据及其相关过程、定义数据(数据类型、大小、默认自值、取值范围等) 、确定数据存储技术等内容。由于存在多个系统的交互、系统内的数据加工处理等,所以一般使用关系型数据库来存储数据,每一个数据项都含有相应的业务含义,如客户编号、客户名称、账号、摘要等;在某些系统中个别数据项存放半结构化数据,如流水信息表中存放的交易输入报文等,通过约定的格式可以对内容进行解析处理。此类关系型数据库的容灾一般由数据库产品保证,包括同城双中心、异地容灾等方式来实现。
而近来随着非结构化数据越来越多, 如视频数据、音频数据、图片数据、文档数据等,传统数据库无法满足相应需求,可以使用nosql数据库来搭建非结构化数据管理平台。此类系统包括票据影像系统、身份识别系统等,通过非结构化数据管理平台(基于如Hbase、ES等)实现数据的统一存储管理、提供查询服务等能力。此类数据库可以通过分布式文件存储等方式具备数据的容灾能力。
随着自然语言处理、文本挖掘等技术的日趋成熟,越来越多的银行开始重视非结构化数据所带来的实现价值, 积极探索数据在营销、渠道、客户等诸多领域的潜在智能化的应用,帮助银行进一步实现数字化转型。