zzy3620
作者zzy3620课题专家组·2023-05-15 09:55
系统环境管理·某城商行

浅谈国产数据库架构、应用场景及其存储适配

字数 4073阅读 4166评论 3赞 9

摘要:

随着国产数据库在国内金融业的逐步普及应用,金融业信息化建设中越来越多系统需要采用集中式或分布式国产数据库替代原有ORACLE数据库,本文主要从国产数据库的存储架构以及场景应用角度进行分析阐述,提供国产数据库存储应用选型思路建议。

1. 国产数据库的市场格局,技术背景以及发展格局

1.1. 国产数据库的发展情况

数据库(Database,简称DB)是按照数据结构来组织、存储和管理数据的仓库。数据库管理系统(简称DBMS)用于建立、使用、操纵和管理数据库,与数据库共同组成数据库系统。数据库向下调用底层硬件资源,向上支撑应用业务,是三大基础软件之一,更是计算机功能实现的重要基础。数据库发展出多种技术路径。按照数据模型、业务负载特征、部署方式、适配硬件架构,数据库可分为多种类型。数据模型决定了数据库的逻辑结构以及数据的存储,组织和操作方式,是最重要的要素。

从全球视野来看,数据库发展起源追溯到20世纪60年代。上世纪七十年代,关系型数据库模型首次出现,面世后在使用中因其对于逻辑模型的高度描述能力进入大众视野,如IBM公司的DB2以及甲骨文公司的Oracle。20世纪末,传统的关系型数据库得到广泛应用,Oracle、IBM等商业化数据库也随之到了蓬勃的发展。而在中国, Oracle、IBM、Microsoft、SAP四家传统厂商的产品曾一度占据国内商业数据库市场超90%,目前Oracle在中国数据库市场可谓是一手遮天。

为了在数据方面实现安全可靠,自上世纪90年代以来,我国就有大大小小众多企业开始涉足国产数据库领域。虽然早期我国数据库厂商发展艰辛,但也获得了不小的成果:中国拥有了第一代原型数据库,也崛起了诸如东软Openbase、中软Cobase和华科DM Database等一系列优秀国产数据库产品。进入21世纪,阿里喊出了“去IOE”的口号,选择使用开源的MySQL,棱镜门事件的曝光,同时基于863计划、核高基计划等国家政策支持,一批拥有高校背景的国产厂商成立,也让达梦、金仓等一批国产数据库得到了广泛的关注,PostgreSQL、HBase等开源数据库也开始活跃起来,国产数据库真正进入了蓬勃发展的时代,一时间数据库行业百花齐放,目前国产数据库产品已有两百余种。

1.2. 国内数据库市场格局

目前海外的Oracle数据库与IBM DB2数据库在我国金融行业占据主导,国产化仍有广阔空间。 同时在金融行业国产化数据库建设中,国产数据库已经从边缘系统逐步走向核心系统, 显示出国产数据库产品功能 、性能水平不断增强,国产数据库厂商竞争力不断提升。借助政策东风,国产厂商厚积薄发,市场版图快速扩张。以阿里云、达梦数据库为代表的国产数据库厂商,在某些行业持续拓展自身业务,获得了一定的市场领先地位。据统计,2020年国外数据库厂商的市场份额下降至52.6%,达梦金仓等传统国产厂商的市场份额上升至7.1%。

目前国产数据库大致可以分为集中式和分布式。集中式发力较早的例如南大通用Gbase、武汉达梦DM、人大金仓kingbase、神通数据库。分布式数据库技术在互联网公司较早研发和应用,其由于自身业务压力或者是被动的研究和改进数据库。例如阿里云OceanBase、腾讯云TDSQL、polarDB,后也有一些大型IT厂商跟进进行分布式研发,例如华为的GaussDB、OpenGauss、中兴通讯GoldenDB、亚信AntDB。

从技术路线上来进行划分,PostgreSQL系有openGauss(Huawei)及基于openGauss开源MogDB(云和恩墨)和Vastbase(海量数据)、AntDB(亚信)、TelePG(中国电信)、Tbase(腾讯)、TDSQL for PostgreSQL(腾讯)等。MySQL系有TDSQL-C(腾讯)、GaussDB for MySQL(华为云)、PolarDB for MySQL(阿里云)、GoldenDB(中兴)、AliSQL(阿里巴巴)、GreatDB(万里开源)等。Informix系有GBasae 8T(南大通用)、Toprow(华胜信泰)及SinoDB(星瑞格)。

1.3 OLAP和OLTP数据库

随着数据时代的发展,企业对于数据也有了不同的处理需求,从场景上分有分析和交易两种类型。面对事务处理和分析决策的需求,OLTP (Online Transactional Processing) 事务型数据库和 OLAP (Online analyticalprocessing) 分析型数据库应运而生。OLTP系统主要使用关系模型,保证强一致性,面向一线业务人员,支持多并发、实时、快速地增删查改,例如银行交易、零售电商、车票预订等;OLAP系统可以高速多维分析来自数据仓库、数据集市或者数据湖的数据,可使用关系型或者非关系型的数据库,主要面向分析师和管理者,支持对历史数据的复杂分析操作,从而赋能企业商业智能决策。随着数据价值的进一步挖掘,企业对数据库系统也提出了新的要求。现阶段企业为满足交易处理和分析的需求,往往采用OLTP+OLAP 的组合方案。但二者之间往往存在时延,无法满足企业实时分析的需求;同时管理两个平台往往需要组建两支团队,运维成本高。 HTAP (Hybrid Transactional/Analytical Processing) 混合型数据库基于新的计算存储框架,能够同时支撑OLTP和 OLAP 场景,避免传统架构中大量数据交互造成的资源浪费和冲突。此外,HTAP 基于分布式架构,支持弹性扩容,可按需扩展吞吐或存储,轻松应对高并发、海量数据场景。

1.4 国产集中式数据库各方面对比

目前国产数据库都有替换Oracle的能力,只是替换程度、效率和性能等各有差异,无论那个国产数据库替换Oracle,都可能需要付出一定的代价,支出一定的成本,而根据项目系统制定一个完好的移植方案将会事半功倍减少代价和成本。一个好的方案需要经过对项目系统的全方面调研,根据业务场景、数据量、业务量、应用特性等诸多方面分析,结合预期移植数据库产品本身特性,如Oracle的兼容性、高可用性、数据安全性及性能情况,选择移植后的架构、以及sql优化等等进行考虑。

在sql兼容性上,目前市面上达梦数据与Oracle数据库的语法兼容性相对高;其他基于pg系的如OpenGuass略低于达梦;MySQL以及Informix系相与Oracle的兼容性则更弱,在表类型、索引类型、高级数据库对象、Oracle语法兼容性、Oracle特色功能兼容性等指标的支持程度上相对范围较小,不支持高级数据库对象、Oracle 兼容接口;

从架构上分析,主流集中式数据库拥有常规的主备集群、读写分离集群架构,达梦目前实现了DSC+ASM功能,仿照银行常用的RAC+ADG架构,目前能提供DSC+DMDW架构。其他集中式数据库目前主要还是使用主备集群的架构。可靠性方面,部分数据库备份还原不支持分级别的备份还原和跨平台备份还原,数据复制均只支持同构复制不支持异构复制;仍然有部分数据库不支持行存储。在数据库智能套件产品方面,目前主流集中式和分布式数据库,均能提供数据迁移工具,sql分析工具等。

从国产数据库的产品适用的应用场景进行分析比较。达梦适用于大规模事务处理、大规模分析处理(中小规模同样适用)和混合型应用;神通、金仓和虚谷都适用于中小型事务处理和中小型分析处理场景;南大通用适用于大规模及中小型的分析处理。

2. “国产数据库+服务器本地盘架构”与”国产数据库+SAN存储”不同搭配间性能对比2. “国产数据库+服务器本地盘架构”与”国产数据库+SAN存储”不同搭配间性能对比

在信创项目的国产化改造中,数据库的高效的运行离不开高性能的基础设施,尤其是数据库数据的存储介质。对于分布式数据库,存储的性能扩展和容量扩展可以通过增加磁盘数量或者存储节点数量实现,而集中式数据库,主要是通过提升本地磁盘或者阵列性能、容量来实现。无论集中式数据库是以服务器本地磁盘阵列方式作为数据存储,还是以SAN存储阵列作为数据库的存储设备,从磁盘类别选择上,都推荐使用高性能的SSD甚至NVME SSD磁盘;但是从集中式数据库采用本地磁盘和采用SAN存储两种方案进行对比,采用SAN存储在多个方面具备一定优势。以下是从各指标架构的对比情况。

从业务场景上来评估,如只是普通非关键业务系统,对数据库的性能、稳定性、可靠性和数据安全性要求不高,且无扩展性要求,或本身环境无SAN存储条件的情况下,可以选择“国产数据库+服务器本地盘”的架构,在服务器本地构建磁盘阵列共数据库存放相关数据文件。如果是关键业务系统,对数据库的性能、稳定性、可靠性和数据安全性要求都很高,且对磁盘扩展性也有要求,建议在有条件的情况下使用SAN存储。

整体而言,无论是设施设备选择还是设施设备的搭配,无论是数据库的选择还是数据库架构的选择,都建议根据实际需求出发进行合适的选择,保障业务的稳定、高效运行以及保证数据的安全。

对服务器进行选择时需要结合性能场景选择普通物理机或者高性能物理机,例如在对Failover敏感,对业务连续性要求很高场景下,或者高并发密集型OLAP的场景下,必须用到RAC集群,那么服务器、网络、及存储就必须全部向最高性能考虑,也只有高性能物理机+SAN存储的方式结合数据库的高性能集群能够满足要求。而集中式数据库的性能,因受限于单个X86服务器的计算性能,当业务需求远高于少量服务器能支撑的算力,读写分离,RAC集群等均无法达到业务要求时,必然需要考虑采用分布式数据库。

另外,由于目前信创的基础设备设施还处于一个起步阶段,无论性能还是稳定性都与原国外基础设施设备存在一定差异,所以为了能够得到最高的性能和稳定性,建议关键业务场景选择性能相对较优的多核心芯片,充分用多核算力提高实例数据库的处理能力。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

9

添加新评论3 条评论

光洋山光洋山数据库架构师金融科技公司
2023-07-10 15:22
100TB的OLTP 就这么被轻松解决???
JAGXUJAGXU存储运维管理ZTZQ
2023-05-23 13:55
学习了
一桶浆糊一桶浆糊存储解决方案架构NA
2023-05-16 16:21
学习了
Ctrl+Enter 发表

本文隶属于专栏

趋势观点
本专栏的文章全部来自国内外行业或领域一线最强实践专家的深刻洞察,他们的分享如同为正在摸索前进的更多同行和企业带来一盏明灯。他们的观点也为企业迎接趋势挑战、克服各种困难提供了最好争议的标的。希望有更多一线最强实践专家加入趋势观点栏目,你们是推动中国企业IT应用最值得尊敬的人。

作者其他文章

相关文章

相关问题

相关资料

X社区推广