具体要看是哪种分布式数据库。
如果分布式数据库可以通过参数配置把底层与数据存储相关的操作和控制交由分布式存储来完成,则二者可很好的结合。
但是如果象TiDB,其本身具有存储节点TiKV Server,负责存储数据,并且TiKV 中的数据都会自动维护多副本(默认为三副本),支持高可用和自动故障转移,并且无法通过参数配置等将此部分操作交由分布式存储系统完成,则很难实现高效结合。
目前在金融行业还没有非常好的分布式存储与分布式数据库高效结合的成功案例。
收起分布式存储和分布式数据库结合是属于存算分离的解决方案。分布式数据库可以给大数据分析提供更快的数据分析和更多的并发服务。由于大数据的数据量较大,通过分布式存储也可以给数据库提供更大的存储容量和更高的访问带宽。
可以以对象存储为基础,汇聚所有类型的数据为多业务平台提供数据服务,联合高性能可扩展的数据仓库平台,为用户提供标准 SQL 支持和超高的查询性能。该解决方案融合了 MPP 数据仓库技术,支持大数据量处理,具有优秀的压缩技术,可以对数据库的常规数据、索引数据、临时表空间数据进行全面压缩。该方案还具备大数据分析能力,支持大量用户并发访问、并行挖掘算法、分析函数等常用功能,具有处理 TB 级或 PB 级数据容量的能力。该方案通过存储、计算、管理分离的系统架构,实现了海量数据的低延迟处理,提升了系统的并发处理能力和扩展性,能够取得近乎无限扩展的并发处理能力。
收起分布式存储通过存储系统软件将通用服务器硬件的本地存储资源组织起来,构建全分布式存储池,为上层应用提供大规模横向扩展、极致效能、弹性按需的块存储、对象存储或文件存储服务。
金融行业的数据急剧增长,对数据存储和管理提出了更高要求。以大型商业银行为例,通常拥有成百上千个业务系统以及上亿用户的海量数据,且数量呈现指数级增长,从 TB 级别增加到 PB 级。
分布式数据库与分布式存储结合,能消除企业各业务系统数据孤岛,构建面向行业场景的数据建模、分析和价值挖掘能力,对多源异构的数据进行汇聚、整合和分析,形成统一的全量数据和数据底座,实现数据价值挖掘和共享。从传统集中式向分布式过渡的过程中,建议根据单位实际情况进行建设规划,从而确保过渡的可行性和可靠性。六大行均有相关分布式存储配合分布式数据使用的场景。
收起相关报道
(记者董潇)每秒交易量超2万笔,每日支撑3亿笔交易,可根据业务需要快速横向扩展......中信银行“凌云”工程投产近3个月来运行稳定,各项指标符合预期,为国内大中型银行核心业务系统分布式架构转型提供了高效可行的“中信银行方案”。
中信银行“凌云”系统是国内率先采用自主金融级分布式数据库(以下简称“GoldenDB”)的银行核心业务系统。早在2019年10月,中信银行已成功投产国内首个基于云架构的信用卡核心系统,而“凌云”系统的投产,成为中信银行金融科技创新的又一里程碑。
自主研发GoldenDB 可靠稳定
银行核心系统是负责存贷款、支付结算等银行业务处理的关键信息系统,是银行的命脉。这套系统要求计算结果精准、处理业务高效,能同时受理大批量业务,能全年每天24小时不间断运行,是高级别的信息系统。数据库是这套系统的“魂”,在支撑系统高效运转中发挥着核心关键作用。
2014年起,中信银行着眼于关键技术自主掌控和对支撑未来业务快速发展需要,联合中兴通讯公司用时5年,成功研发了满足银行业务特点的GoldenDB。“凌云”系统投产以来,GoldenDB运行稳定,各项技术指标表现优异,成功支撑了中信银行每天近亿笔的交易规模。
创新工具工艺 高效率低成本
中信银行在“凌云”工程建设中不断创新,研发新工具和新工艺。银行核心业务系统的建设一般需要投入大量人力用于系统开发和测试,同时还需要平衡业务新需求与系统建设的交付冲突。而“凌云”工程研发了RPG2JAVA代码翻译和仿真比对工具,实现程序自动翻写及自动化高仿真测试,做到新老系统连续24个月同步研发、同步发版。“凌云”工程实施了基于DevOps理念的研发流水线和面向大型分布式应用的运维体系,缩短了新功能交付周期,做到了对系统全方位实时监控,提高了系统的容灾能力,缩短了系统故障恢复时间,保障业务高质量发展。
目前,“凌云”系统支持3亿客户、15亿账户,并可根据业务需要快速横向扩展,将为中信银行全力服务实体经济、积极防范金融风险、全面实施数字化转型提供强劲“新引擎”。
收起