zhangpeng4007
作者zhangpeng4007·2023-06-01 10:42
系统运维工程师·某城市商业银行

商业银行异构存储迁移实践-需求分析及设备选型篇

字数 3736阅读 3910评论 1赞 2

【摘要】

本文以核心存储扩容项目为背景,通过对部分业务数据向异构存储迁移的方式,实现原有核心存储空间回收与扩容的目标。基于业务特点、基础环境配置、业务连续性和技术成熟度几方面综合考量,最终选择从操作系统层面进行异构存储迁移。尽管该迁移方案与实现技术手段未必是最优最新,但本次数据迁移的成功,为异构存储迁移实践积累了成功的可行性经验,同时笔者也从需求分析及设备选型,迁移方案设计,迁移实施过程和实践效果分别进行了总结与复盘。

全文共分为三个部分:需求分析及设备选型篇、迁移方案设计篇、迁移实施过程和实践效果篇;需求分析及设备选型篇通过项目背景与目标,重点拆解业务系统需求,有针对性地设计技术要点和实施重点;迁移方案设计篇主要从异构存储特点出发,结合业务制定有针对性并且合理的迁移目标,对于方案设计中关键性技术进行详细的准备与测试,包括确认方案中重要前置条件和模拟迁移估算时间等,确保迁移方案有效可落地;迁移实施过程和实践效果篇主要以步骤检查表的形式,供异构存储迁移进行参考避免疏漏。最后分享迁移过程和之后一周的性能数据与业务反馈,并对异构存储整体迁移效果进行经验总结:多参考与论证落地的成功案例、多注意产品差异与安全性的细节、最终选择最适合的迁移方式。

本文为第一部分:需求分析及设备选型篇。


一、 项目背景

我行自2018年新一代核心业务系统上线以来,随着金融行业的快速发展,核心业务也随之高速发展和快速迭代,同时对核心存储的功能、性能、容量以及连续性等方面的提出了更高的要求。核心存储主要承载行内核心及关键类业务系统数据库,按照行分级标准,需要两地三中心部署,通过克隆、存储同步与异步复制等多种数据保护技术,保证访问的高并发性和数据的强一致性。但由于近几年我行核心业务发展超出预期增长速度,核心数据库主要账务表空间使用率过高,清理容量有限,数据也达到总闪盘容量的90%以上,按现有的增长速度,容量风险较高,需要及时对主、备中心存储,有针对性地对闪盘进行补充。因此我行计划对核心存储进行扩容。

二、 建设目标

针对本次核心存储扩容项目,我行明确要将内控合规、降成增效原则始终贯穿于项目管理、运维规范以及异构存储迁移的整个生命周期。

对于内控合规要求,重点会放在运维相关的制度、细则、手册,项目实施过程中满足项目实施、业务连续性与数据管理的相关制度原则,在基础的实施、配置、变更、测试、上线等操作层面,同时也要按照操作细则和手册进行规范化、标准化设计与评估,规避发生计划外的操作,对业务连续性产生不良影响。

降本增效目标主要体现合理化降低项目时间、实施难度、专业人员投入、后期运行维护成本,其中后期运行维护成本重点考虑机房内基础设施资源的占用,运维人员日常巡检、故障处理、配置调整、报告趋势分析和定期演练等运维成本,选择成熟的技术路线并逐渐整合,降低技术复杂度;而增效的目标主要体现在可靠性、可用性和业务连续性提升,对于业务系统提出的数据保护场景,能够在线、快速并高效实现,无论在容灾实施过程还是在设备补丁过程,都保证业务的稳定性和连续性,提升整体业务系统的使用效益目标。

由于原有核心存储主备中心型号并不一致,容灾中心存储型号在配置方案制定时,已无法进行设备内扩容,需要通过增加存储设备的方式实现扩容。因此,计划直接采购两台高端存储,分别放置江北数据中心与同城容灾数据中心,以采代扩,以近似的实施配置成本,根据源端、目标端存储容量与性能,有针对性地将使用高速闪盘的低耦合性核心业务迁移至新的高端国产存储架构中,缓解原有存储容量与性能压力 。 前期会选择信贷业务进行存储迁移,后续其他业务数据迁移会在容量与性能进一步补充之后按计划进行。

因此,本次项目建设目标明确为:通过对部分业务数据向异构存储迁移的方式,实现原有核心存储空间回收与扩容。

三、 存储选型思路

计划采购的2台存储,选型思路会尽量在国产化品牌高端存储中,挑选具有良好同行业案例的品牌。除了商务部分以外,主要在技术要点、实施重点和售后服务三个维度考虑。

  1. 技术要点

技术要点主要考虑配置与功能、性能指标、国产化支持、稳定性、可靠性、兼容性以及可扩展性。

配置与功能指标主要考虑的因素有存储控制器支持A/A全双活,读写缓存容量,存储部件保证高冗余配置,并是否实现端到端双活,RAID保护后的可用容量;

性能指标需要考虑的存储整体性能需满足未来承载数据库的日常访问与批量的总体要求,尤其关注容灾生效状态下,IOPS峰值(50%-80%随机读)、带宽峰值和延时时间;

国产化支持因素考虑存储控制器芯片国产化支持度,满足自主可控要求;稳定性、可靠性因素需要核心存储产品软、硬件解决方案可靠性,稳定性达99.99%以上,同时存储双活/复制容灾方案技术成熟,支持在线部署,综合场景存储双活状态下单存储故障恢复结果可靠恢复时间可预期,双活或复制状态下性能与单存储相比损耗不超过20%,存储数据保护(快照或克隆功能等)可保证与原数据一致,支持增量与反向同步,性能无损;

兼容性因素需要存储硬件更换、软件版本升级业务无感知,与其他厂商存储硬件可统一管理,数据平滑迁移。在异构存储迁移实践中,务必考虑目标存储与现有环境的基本连通性(包括操作系统、多路径以 、HBA以及现存多路径软件 )、集群软件、备份软件、卷管理软件、光纤交换机、异构虚拟化(如需要)、存储虚拟化网关(如存在)、加密设备(如存在)、运维一体化管理软件、集中监控、标准化应急处置平台等,对上述因素的整体考量且均满足需求,才能形成完备的异构存储迁移能力。

可扩展性因素需要存储产品具备控制器、缓存、前后端接口卡与磁盘容量的可扩展性,能够满足未来承载更多业务的性能,同时存储双活、复制、快照与克隆等数据保护软件,容量扩容时不再额外收取费用。

2.实施重点

实施重点主要考虑 存储双活/存储容灾实施案例与交付效果、自动化运维与切换工具的交付完整性以及厂商实施人员资质、经验以及在本项目工作量饱和性、交付物完整性等。

存储双活容灾实施方案会考虑其完整性与合理性、符合本项目建设要求,可行性,保证交付效果;自动化运维与切换工具的交付完整性因素会考虑存储设备的可满足行内监控策略,具备告警机制,并能与现有自动化运维平台兼容,具备脚本化切换的支持能力。

3.售后服务

售后服务需要在项目集成、数据迁移与业务迁移的基础上,能够现场保障切换演练,持续跟踪分析性能与容量使用情况,完善存储容灾容错切换手册等工作。

四、 选型情况

我行现有核心存储生产与灾备中心的型号分别为EMC VMAX200K及VMAX40k,主要承载核心及关键系统数据库。根据上述 选型思路中的技术要点、实施重点、售后服务以及商务部分几个维度考虑,重点考虑异构存储迁移的可行性,结合POC实测的技术指标情况,综合进行了选型论证。目标存储厂商需具备迁移技术和工具软件,如异构虚拟化软件、数据迁移软件或者存储卷镜像建立和拆解等,同时具备对系统、数据库层面具有可落地的实操经验、完备的迁移流程和业务平稳过渡能力。 最终 在 国产高端存储品牌中, 决定 选择了华为OceanStor Dorado18500型号作为异构存储迁移的目标端产品。

华为OceanStor Dorado 18000 系列高端存储通过“软件全均衡,硬件全互联”的全互联架构,在可靠性,吞吐量和时延上均有很好的表现。

高吞吐:由于业务被前端接口卡均衡下发给了4个控制器,避免了业务阻塞在某一个控制器上造成性能瓶颈,充分利用了控制器资源,因此华为OceanStor Dorado 18000系列高端存储能实现业界第一的最高2100万IOPS;

可靠性:华为OceanStor Dorado 18000系列高端存储硬件全互联架构,从架构上保证了业务的高可靠。首先,前端共享接口卡与4控互联,业务在前端接口卡进行分发,使得控制器损坏后在IP地址漂移等过程中业务无中断、前端无感知;其次,双引擎八控共同接管一套硬盘阵列,提供了业务具有最高允许控制器八坏七的容错能力;数据在底层硬盘打散均衡存储,最大程度保护了数据的安全可靠。

低时延:华为OceanStor Dorado 18000系列高端存储通过端到端N VMe 加速设计,达到了业界最低的端到端0.05ms时延。

迁移能力:中高端存储在异构存储管理和迁移能力上已有积累,异构虚拟化软件SmartVirtualization、数据迁移工具SmartMigration 和卷镜像建立拆解工具 HyperMirror 的配合使用 ,使得数据安全、完整、无中断地在异构存储间迁移,具备简单平稳的迁移能力。

此外,华为OceanStor Dorado 18000系列高端存储C PU 采用鲲鹏9 20 ,操作系统为欧拉操作系统,均为国产自主产品。同时免网关形式的SAN&NAS一体化A / A双活,应对最苛刻的企业可靠性需求。

五、 总结

银行核心系统存储选型上,会着重考虑品牌情况,产品案例,保护功能以及售后服务情况,最后结合项目的具体实施质量,结合行内固有的监控与自动化运维平台,保障存储服务的连续性、数据安全性与标准化、自动化能力,进一步保障业务长期稳定、高效运行。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论1 条评论

匿名用户
2023-06-02 08:16
内容很精炼,已读!
Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广