cpc1989
作者cpc19892020-12-14 12:50
存储工程师, 某保险公司

传统险企云存储架构的演进策略分析

字数 4090阅读 3469评论 0赞 2

1 概述

集中式存储具有着较高的安全性、可靠性,在以往很长一段时间内一直是企业关键业务的数据支撑。近些年, 云计算技术得到了较为广泛的使用,也进一步推动了企业 IT 基础架构的转型与发展。相比技术架构层面的变革,云服务模式更加深入人心。云服务将企业各种 IT 技术组件抽象成灵活、透明、弹性的资源对象,并以服务的形式提供给授权用户,更加贴合以客户中心的 IT 服务理念。

数据是企业的核心资产,而存储是数据的载体,其重要性不言而喻。云存储是在云计算基础上衍生、发展而来,遵循云服务理念,为用户提供高效、可靠、弹性扩展的存储服务。下文将以笔者所处的某传统中小保险公司为例,从云存储架构演进的驱动力和演进的 PDCA 过程这两方面内容,谈谈云模式下的存储架构变革与演进策略,希望对同行有一定的借鉴和参考价值。

2 存储架构演进之驱动力

任何一种架构体系都不会一成不变,而是需要与时俱进。采用逐步稳妥推进还是除旧迎新式变革的方式,关键在于弄清楚促使架构演进变革的驱动力。而促使企业 IT 技术架构变革的驱动力可以概括为外在与内在两种,外在驱动力主要是外部环境变化的驱动,内在驱动力可以理解为内在的优化需求驱动。理解 IT 技术架构变化的驱动因素,从而发现原有技术架构可预见的缺陷,进而为决策技术架构演进提供依据。存储作为 IT 技术架构的底层支撑,在研究其架构演进时,也可以从这两个方面来剖析。

2.1 外在驱动力

  • 业务创新

对于保险行业来说, IT 服务关注于面向产品、渠道、销售这三个方面业务内容。以我司传统保险业务为例,传统保险产品研发周期长、同质化严重,更依赖于渠道和销售;渠道方面,传统险企对于银保等线下渠道较为依赖,互联网渠道、线上业务渠道的业务占比过小;销售模式方面,传统保险业务特别是传统寿险产品,由于其周期较长、保险规则较复杂的特性,其销售模式较为依赖于线下销售。整体来看, IT 技术对于传统保险业务更多是基础的服务支持作用,对技术变革的需求并不迫切。

但在最近五年间,商业健康险的原保费收入规模年复合增长率达到 35% ,远远超过整体保险行业原保费的增速,叠加国家对于商业健康险不断加码的利好政策,是各家险企不可不重视的业务模块。健康险有别于传统保险模式,离不开科技和数据的支撑,对于保险服务内容、服务环节、核保核赔、风险控制等环节提出了更高的要求;同时,今年突如其来的疫情是一个契机,既是风险也是机遇,传统保险业务的线下展业方式受到较大影响,线上销售、服务之间的差距凸显,但居民对于健康险和监控管理服务的需求进一步得到提升,我司也坚定了逐步转型线上模式的 IT 战略规划,坚持渠道和销售模式的创新。

产品、渠道、销售模式为主的业务创新是至关重要的技术架构演进的驱动力,对应的是海量、高性能、高可用、弹性扩容的存储需求。在面向互联网保险业务模式场景时,传统的集中式存储架构会存在明显的性能与容量瓶颈,只能通过不断地硬件迁移或扩容来应对。

  • 技术创新

技术创新也会带来存储架构的变革,可以分为两个层面来考虑:一是新技术的成熟应用需求,二是不同技术架构应用、落地后的融合需求。

存储新技术主要在存储介质、数据传输以及上层数据应用这三个方面突破。目前主流存储介质已经从 HDD 向 SSD 过渡,带来了存储访问速度和整体容量的大幅提升;数据传输方面,数据带宽的倍增和存储协议技术的发展,带来了存储带宽和传输效率的提升;而在上层数据应用方面,伴随着存储使用场景,存储技术发展相对更为多样化,大数据对应的是分布式文件存储,云计算对应的是分布式云存储,海量非结构数据对应的是对象存储等。企业需要引入逐渐成熟的新技术来服务于自身不同层次的应用需求。

新技术的应用和落地后,还需要做好技术实践的总结,从而能更好地与现有的技术架构融合。而不同存储架构的融合,也会进一步推动整体存储架构的演进。多云平台的融合,分布式云存储与大数据的融合,云平台与集中式存储的融合,对象存储与传统应用的融合等等多种融合方式,可以进一步演进出特定的存储使用场景和存储架构。

2.2 内在驱动力

  • IT服务质量

IT 服务管理的目的是以客户为中心,提供高质量、低成本的服务。对于企业 IT 技术架构来说, IT 服务质量也是重要的内在驱动力。在企业 IT 服务实践过程中, IT 服务质量评价指标主要包括功能特性、可靠性、易用性、效率性、可维护性等。对于企业存储架构来说,功能性主要体现的是满足多种业务场景、技术架构的需求;可靠性体现在存储的可用性,安全可靠,满足架构冗余和灾备需求;易用性体现在技术可视化程度高;效率性体现在通过标准化、自动化等方式提供存储服务,存储资源供给等方面服务效率提升;可维护性体现在整体存储架构耦合性低,维护成本低。 IT 服务质量工作贯穿 IT 服务的整个生命周期,通过 PDCA 循环指导质量策划、质量实施、质量检查、质量改进等活动,从而实现存储架构的优化演进。

3 存储架构演进之 PDCA 过程

在理清了促使企业 IT 技术架构演进的内外在驱动力之后,才能更好地从实际需求出发,去制定技术架构演进目标。云存储架构的演进可以参考如图 3.1 所示的 PDCA 模型方法,采用循序渐进、不断优化的方式实现。

图 3.1 PDCA 模型图

3.1 计划( Plan )

该阶段着重于确立整体存储架构目标。对于我司来说,分布式存储架构主要用于新的线上业务场景,集中式 SAN 存储和 NAS 存储在传统业务场景依然占据重要地位。从行业发展趋势和企业 IT 战略转型方向来看,传统业务依然处于基础性的重要地位,这也决定了集中式存储架构将与分布式存储架构的长期并存的状态,亦即传统稳态 IT 与敏态 IT 共存的双模 IT 模式。

新的线上业务场景中,需要构建起开放共享、透明高效、按需供给的云计算资源管理模式,以适应分布式的整体 IT 架构。相比于传统的快存储和文件存储接口,分布式存储还需要提供对象存储接口的存储服务。同时,海量的半结构化和非结构化数据也需要通过分布式存储来构建可弹性扩容的数据湖,采用基于策略的数据全生命周期管理,提供热、温、冷不同资源池,实现数据在不同资源池以及云平台间的流动和分层。

最终确立了云存储架构的目标,建立面向多种云平台,统一纳管异构存储资源,提供多种类型数据接口、面向海量数据场景的数据湖。整体架构图如下所示:

图 3.2 整体云存储架构图

3.2 实施( Do )

实施阶段主要是按照存储架构规划目标,实施云存储架构演进的落地。相比于原有集中式存储架构,新架构引入了分布式云存储、异构存储管理以及存储访问层组件。分布式云存储通过虚拟化技术将集群存储资源高效聚合,以存储池的形式提供快、文件和对象存储接口服务。分布式存储具备多副本及数据一致性特性,支持分级存储,拥有极强的横向扩展能力;异构存储管理组件实现了分布式存储和集中式存储的统一自动化资源供给、监控、数据可视化等功能,实现各存储设备间的协调工作;存储访问层组件是将分布式存储层的接口封装为 WebService (基于 RESTful 协议等)服务,并实现存储资源与多种云平台存储访问接口的对接。

分布式存储部署在通用 X86 服务器上,基于 TCP/IP 网络协议,通过分布式存储软件将分散的存储盘整合为存储池,为上层提供存储服务。考虑到初期数据量较小,引入试点采用 6 存储节点 3 数据副本的策略,可提供近 60T 的存储空间。其中大容量低成本机械硬盘存储数据,高速 SSD 存放元数据,有效平衡性能、容量和成本。分布式存储初期用于新的线上业务场景应用,为 OpenStack 私有云平台、容器云平台提供存储服务,后续可以按需无缝扩容存储。

3.3 检查( Check )

检查阶段重点对已实施的存储架构进行检查和评价,评价指标主要包括:功能特性、可靠性、性能、存储管理等方面。

功能特性:主要评价存储架构的场景适用性,分布式云存储系统面向多种类型的网络在线存储服务,而传统存储主要面向事务处理以及传统业务场景。

可靠性:评价存储架构的数据安全可靠性,分布式云存储通过多数据副本和纠删码技术保障了数据的可靠性,存储组件分布式,可用性高;而传统存储主要通过 Raid 技术保障数据可靠性,通过存储冗余部件实现高可用。

性能:评价存储架构的性能及其瓶颈,分布式存储可以通过扩容存储节点提供更高的存储性能,传统存储在性能的扩容方面较为乏力,需要设备升级或迁移。

存储管理:评价存储架构易用性、效率性、可维护性等方面的特性,分布式云存储提供全面的存储可视化,弹性扩容,自动化程度高;而传统存储的可管理性较差。

3.4 改进( Act )

改进阶段的工作是总结云存储架构演进的得失,并规划后续的演进优化方案。云存储架构演进的过程中的成功点在于,在新的线上业务场景,特别是在 OpenStack 云平台和容器云平台架构中,分布式存储可以很好地满足相关的存储需求,按需扩容,有效平衡性能、容量与成本。与传统集中式存储相比,在存储性能、可靠性、可扩展性与自动化管理方面都有一定的优势,有效解决存储资源准备与分配周期过长的难点。但是在传统保险业务模块中,还存在着相当的传统竖井式的应用系统架构,并不适合适配分布式池化存储架构,还将继续使用集中式存储架构。这类应用架构的改造需要通过业务层面的演进去实现。

后续的改进工作在于继续挖掘云存储架构的应用场景,增加分布式云存储在整体存储架构中的占比。改进策略是从边缘场景展开,在生产实践中进一步的验证云存储架构的稳定性和可靠性,目前可预见的两个方面的场景:一方面是大量的离线备份数据的备份场景,此类数据量大,访问频率较低,可以结合备份软件实现冷数据的离线备份、归档;另一方面,在实践中发现,分布式对象存储相比于传统 NAS 存储来说,更适合于海量小文件的存储。保险行业传统业务中也会出现大量的电子保单、影像以及双录文件等非结构化数据。后续计划通过系统改造等方式逐步将原传统业务的这类非结构化数据逐步迁移到分布式对象存储中。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广