zp_ccc
作者zp_ccc·2016-11-17 01:20
高级技术主管·国内某金融科技公司

“软件定义”重新定义商业银行的IT基础架构

字数 7466阅读 6509评论 0赞 2

1. 需求与痛点

商业银行是中国金融行业的重要组成部分。国内商业银行一直注重IT体系建设,经过多年的发展已经形成了一整套比较完备的IT体系。当前商业银行的业务与各行各业都息息相关,业务种类繁多,支撑业务系统的IT系统也纷繁冗杂。本文仅针对商业银行比较通用并常见的几类业务的IT系统进行分析,从IT架构顶层设计方面提出建议。

商业银行IT系统按照业务划分为几大类:

传统银行业务类,主要包含银行的核心账务系统,存取款业务,支付结算业务,信贷业务,卡业务,投资理财业务,客户关系管理,电子银行业务等等。商业银行通过这些业务提供基本金融服务。

渠道类业务,包括中间代理和电子渠道类业务,随着现代生活的改变,手机银行,网上银行,互联网相关的金融衍生业务发展迅速。

决策分析类业务,主要包含银行进行金融产品管理,财务管理,客户关系管理,渠道管理,资产负债管理,风险管理,内控合规管理,投资理财管理,运营支撑管理等等。

随着社会的发展,人们金融意识的转变,互联网金融思潮的兴起,对传统商业银行的冲击都不小,目前商业银行的几类主要业务所面临的如下问题:

传统银行业务的工作负载特点比较明显,日间交易高峰时段多出现在上午10:00-12:00和下午14:00-16:00的区间内,此类业务特点是随机性强,并发性强,业务影响范围广,业务连续性要求高,对IT系统的主机计算能力和存储的I/O能力要求比较高。夜间日终结算区间内批量业务比较多,此时需要更多的IT系统的计算资源和存储的I/O能力。

渠道类业务随着人们消费意识的转变和互联网商业的兴起,业务工作负载也有一些特点,卡业务,手机银行,网上银行等业务在非工作时间比较集中,并且在商家的假日营销,季节性促销会出现业务爆发性的增长,此类业务的特点是突发性强,并发压力大,业务影响范围广,业务连续性要求高,对IT系统的各类资源的动态调配能力要求比较高。

决策分析类业务是银行满足自身安全,稳定发展的要求,也是银行开拓思路,创新经营的利器。安全运营需要风险分析和合规管控;创新经营需要综合数据分析提供决策支撑。此类业务的IT系统目前面临主要问题的是如何进行海量数据的有效,高效的分析。

以上几类业务所面临的问题归结起来,现阶段商业银行用户的痛点主要有几方面:

  1. 目前大部分商业银行的IT系统资源,基本能够满足日间交易处理,但是如遇突发性的商业活动,年终结算等时期会有较大压力,主要体现在应用的并发能力,主机的计算能力,主机的资源调度能力,存储的I/O吞吐能力等不均衡或能力弱产生的瓶颈。
  2. 面对新型业务系统采用传统集中式IT架构,难以满足客户的便捷性用户体验的要求。
  3. 银行经营决策分析,迫切需要更高效的数据分析体系架构,来进行经营管理,精准营销,风险预警。

2.解决方案

面对诸多问题需要商业银行结合自身的业务特点,改进现有IT体系架构,引入新兴技术,应对新的挑战和机遇。云计算和大数据技术的兴起,为商业银行的技术变革提供了新的思路,即由传统IT基础架构向软件定义基础架构的转变。

“今天,很多人提出了SDN(软件定义网络)、SDD(软件定义数据中心)、SDS(软件定义系统)。而我认为,软件可以定义世界(SDW),软件应该成为世界的核心和灵魂,成为信息消费的重要引擎和重要内容。”——工业和信息化部软件服务业司司长陈伟这样说。

软件定义一切,不仅仅是一个概念,而是实实在在的技术演进。商业银行构建新的IT体系架构应该从软件定义着眼,运用云计算,大数据等技术,满足未来发展的需要。

商业银行面向软件定义的总体架构设计如下:

2.1 技术层面的变革

商业银行IT基础架构的顶层设计可以参考云计算分层布局,分为三个层次。

2.1.1 IaaS层规划

2.1.1.1 统一资源管理

IaaS(Infrastructure-as-a-Service)基础设施即服务层,引入IBM企业级云平台ICM(IBM CloudManger with OpenStack)实现IaaS的资源统一调度和管理。ICM是在开源的OpenStack基础上,增加了改进和添加新的功能,使之更适用于企业级应用。通过ICM可以实现资源申请,资源变更,资源回收,资源操作,资源监控,配合管理,权限管理等等功能。

IaaS层的物理资源主要包括计算资源,网络资源,存储资源等等。

2.1.1.2 计算资源

由于商业银行的应用系统多运行于RISC架构和Intel X86架构的计算资源上,通过IBM所以POWER系列服务器和X86服务器组成计算资源池。由IBM Power VC 统一管理IBM POWER系列服务器通过power VM和power KVM技术提供的power架构计算资源,可以提供AIX和POWER Linux操作系统平台的虚拟机,支持国内绝大部分商业银行传统的应用系统。X86服务器资源通过KVM,vmware,hyper-v等虚拟化技术提供的计算资源,提供主流的Linux和windows等操作系统平台,适用于国内商业银行的外围业务系统,新型业务系统,决策分析系统等应用系统。计算资源通过ICM 的Nova服务统一进行管理。通过对计算资源的池化可以解决目前商业银行IT系统对计算资源分配不合理的问题,池化后的计算资源统一管理,统一调度,可以按需动态分配给某一IT系统,解决业务高峰期计算资源分配不均和计算资源争用的问题。

2.1.1.3 存储资源

随着商业银行的数据增长量大,对存储的性能要求日益增高,传统机械式硬盘存储由于自身原理限制,想要突破性能瓶颈已经很难,同时方案设计时还要兼顾目前大多数商业银行的既有投资,所以在进行存储资源设计时,引入IBM Spectrum Storage (光谱存储)家族的产品,整合现有资源的同时引入新技术突破性能瓶颈。

首先,以块存储虚拟化SVC技术为核心的IBM Spectrum Virtualize实现异构存储的整合和存储虚拟化,通过在数据中心部署IBM Flashsystem V9000产品可以实现如下功能。

  1. 实现异构存储整合,管理商业银行现有的异构存储环境,
  2. 通过V9000强大的FlashCore全闪存技术,实现高吞吐,低延时的存储功能。
  3. 通过存储虚拟化技术的thin provision功能实现灵活的存储空间管理。通过Easy Tier功能自动的实现热点数据的迁移,提高性能。通过real-time data compression功能实现最大限度的空间利用。
  4. 通过Flashcopy 基于时间点的拷贝功能实现关键业务数据的实时保护。
  5. 通过remote copy的同步metro mirror和异步Global Mirror功能,实现现阶段商业银行两地三中心的灾备建设需求,满足业务连续性要求。
  6. 通过添加闪存容量(纵向扩展)以支持更多的应用程序,通过扩展虚拟化系统(横向扩展)以支持更高的每秒 I/O 操作 (IOPS) 与带宽,还可同时纵向/横向扩展解决方案以增加容量、IOPS 与带宽并维持 MicroLatency。
  7. 可集成工作负载部署,包括绕过存储虚拟化层以实现低延迟的数据访问、通过Easy Tier 的数据访问、使用 Real-time Compression 的数据压缩以及将数据复制到灾难恢复站点。

    其次,引入以强大的GPFS(Elastic Storage)为核心的IBM Spectrum Scale技术,改进传统计算和数据存储访问模式。可应用与传统业务IT系统以及数据分析业务的IT系统环境。

  1. GPFS作为数据存储层,提供了数据并发访问的能力。
  2. GPFS 的集群扩展技术,提供了横向扩展的能力,满足计算资源动态增长的需求。
  3. 结合DB2 GDPC和Oracle Extended RAC技术可以跨越数据中心实现对称工作负载的双活数据中心,并且通过GPFS File system Descriptor Quorum ,Node Quorum ,Tiebreaker quorum三种机制实现GPFS的高可用性。
  4. 配合TSM使用,实现多节点数据库的备份和恢复。
  5. 在决策分析业务中的数据集成,大数据分析领域提供分布式处理能力,降低存储延时,提供高文件读写性能。

    再次,部署IBM stormize V7000,v5000等存储提供大空间存储容量,并且通过IBM Spectrum Control实现磁盘存储、全闪存阵列、文件存储、对象存储的统一管理,以及存储分层的优化。

    最后,部署IBM System Storage TS3500磁带库并通过IBM Spectrum Protect数据备份恢复解决方案和IBM Spectrum Archive近线磁带文件系统,实现银行关键业务的数据备份与数据归档。

  6. 保护虚拟机、物理机以及云平台的全部数据
  7. 提供快速备份和恢复的能力
  8. 通过整合管理任务简化备份
  9. 提供应用感知(Application-aware)和虚拟机感知( VM-aware data)的数据保护
  10. 内置特性:去重,增量永久备份
  11. 集成多站点复制和灾备,作为灾备系统的有效补充。

2.1.1.4 网络资源

IaaS层的网络资源通过ICM 的Neutrom服务提供统一的资源管理,未来商业银行的每个业务部门都可以通过虚拟网络功能,创建属于自己的数据中心虚拟网络。

2.1.1.5 智能调度

在IaaS层整合资源并需要对资源智能的调度,通过IBM Platform Resource Scheduler,简称PRS来实现。PRS可以整合异构资源进行设置统一调度策略为云平台提供静态和动态两种不同的调度策略,所谓的静态调度策略主要是当租户在创建计算,存储,网络资源的时候,静态调度策略会根据租户的约束条件帮助租户找到最优的机器来部署资源。动态调度策略当租户的应用在云平台运行时,可能会因为一些作业的运行导致某些服务器的负载发生变化,动态调度策略用来帮助租户针对这些变化通过云平台做一些动态调整,例如对虚拟机进行迁移等等。

2.1.2 PaaS层规划

PaaS(Platform-as-a-Service)平台即服务层,提供对IaaS层资源的统一管理,并将这些资源的调度通过API开放给SaaS层用户。

1.通过预定制操作系统、数据库、中间件、开发工具等模版,为各类应用部署提供所需的操作系统,数据库,中间件等资源。实现快速部署,标准化管理等功能。可以极大缩短商业银行业务部门对IT系统上线的时间,确保IT系统基础环境的安全、规范、稳定。

2.整合各类系统的监控数据,实时监控平台的各种资源,并将这些资源的监控数据通过API开放给SaaS层用户。

3.通过引入IBM Platform Symphony产品家族的并行服务中间件和网格管理软件,搭配x86架构计算资源,并行文件系统支撑的海量存储资源,结合业界流行的hadoop大数据应用平台,可以为大数据分析,风险管理,决策制定等业务,提供强有力的基础环境支撑。

4.提供租户和平台管理员与平台各种资源之间相互协调工作的管理控制模块。

2.1.3 SaaS层规划

SaaS(Software-as-a-Service)软件即服务层,主要是商业银行的业务应用系统,进行底层架构的改变,传统业务应用、新型业务应用、数据分析型业务等应用需要结合云架构进行相应的转变。

1.对称工作负载双活数据中心的底层架构之上,业务应用系统需要能够支撑双活数据中心的业务逻辑,各业务系统之间的数据流向,以及异常情况下的业务切换。

2.新型业务应用,例如基于互联网的金融商城,可以参考互联网电商的模式,通过底层动态可扩展的计算资源和存储资源,搭建以分布式存储,分布式数据库,分布式计算为核心的应用架构,改进业务模式,拆分繁杂交易逻辑,提高交易的响应时间,提高交易的并发处理能力,为用户提供更好的用户体验。

3.数据和决策分析型业务应用,可以充分利用云计算体系架构中资源动态调度的优势,利用分布式架构的特点,结合大数据分析技术,转变传统分析系统的体系模式。

2.2 管理层面的变革

商业银行的IT体系架构不应该仅仅是技术层面的转变,管理层面也需要进行变革。从而能够更加高效的应对社会的发展和挑战。

IT部门由单纯的服务支撑部门,转变为服务提供的业务部门,IT部门可以为其他业务部门提供可计量,可计价的IT服务。

业务部门从单纯的处理业务、单纯的给IT部门提需求,转变为参与到IT系统规划中,业务部门通过云架构支撑的自服务平台提出资源申请,获取所需的资源。并通过自服务平台可以直观了解所获得资源的价值。这样可以避免资源的分配不均,过度浪费,减少业务部门和IT部门衔接不一致造成的资源的浪费。

云平台的自服务,自动运维能够解放IT部门的日常重复性操作,IT部门可以从事更多有价值的服务工作,可以为其他部门提供更好的技术服务。

银行各部门的考核也从之前的无数据支撑,转变为可量化,可视化,对提高各部门整体协调能力,提高银行运营综合效能起到推进作用。

3.方案的优势

  1. IT基础架构的变革,驱动商业银行IT管理体制的变革,IT管理部门摆脱繁杂琐碎的重复性基础工作,提高IT部分的创新驱动能力,能够使得IT部门的价值更好的体现。
  2. 通过IBM 软件定义架构的商业银行IT架构的重塑,以云计算为核心的资源管理,提升商业银行IT资源整合,资源动态分配,资源按需分配,资源智能调度,资源自动化运维的能力。
  3. 通过存储虚拟化整合IBM 全闪存阵列与传统存储,可以满足各种应用对存储资源的需求,解决长时以来存储性能成为瓶颈的难题。
  4. 全闪存阵列提供高吞吐能力的存储能力,提供低延时的响应时间,加快应用系统的运行。闪存阵列具有低功耗,低空间使用率的特点,可以大大降低商业银行综合使用成本。
  5. IBM Platform Symphony产品通过服务并行化加速面向服务应用的速度,提供极高的应用并行度和吞吐量和极低的延迟,将计算和数据并行应用运行在同一个平台上,支持以MapReduce逻辑编写的应用,并且100%与Hadoop兼容,具备功能强大灵活和多层次的资源共享部署。可以大幅度提高分析决策的及时性,提高分析精度,实现从前无法进行的大规模风险分析,和实时价值评估,降低了IT固定资产设备成本,极大地提高了基础设施的利用率,减少了部署时间和成本-,以标准化的方式快速部署新的应用,削减了IT管理运营成本- 通过单一管理平台管理多种应用。

4.典型案例分析

以上方案中一个核心价值体现是全闪存阵列的应用,解决性能问题的同时,也大大降低银行的综合使用成本。下面就某一商业银行的全闪存阵列的应用案例,再次深入描述闪存所带来的价值。

几年前国内某商业银行建立了生产和同城灾备系统,该灾备系统采用具有连续数据保护功能的专属数据复制设备。生产中心主存储为企业级中端存储,生产中心的数据复制专属设备的后端也采用企业级中断存储,数据通过主机镜像功能,同时写入生产主存储和数据复制存储。数据复制设备开启连续数据保护功能,以及数据复制功能,将数据实时灾备到同城灾备中心。

灾备系统建设后达到的建设效果:

  1. 双存储高可用保护
  2. 连续数据保护提供基于时间点和I/O级别的保护,提供防御物理故障和逻辑错误的全面保护。
  3. 窄带海量数据传输。
  4. 可实现瞬时切换。
  5. 攻克灾备数据“只备难验”的难题,可随时快速验证。

随着银行的业务发展,IT技术进步,设备的更新换代,原有的灾备系统已经出现了瓶颈。主要表现为:

  1. 生产中心主机为了应对银行业务快速增长,由中端服务器升级为高端的服务器,计算能力大幅度提高,此时存储I/O便成为应用处理的主要性能瓶颈。
  2. 生产中心存储为了应对银行业务数据量的快速增长,由中端存储升级为高端存储,生产主存储一端的I/O吞吐能力大幅提升,此时作为镜像的另一端数据复制存储成为了I/O性能的瓶颈。
  3. 数据复制专属设备需要开启快照,录像,复制等多种功能,数据复制的原有中断存储承载的功能繁多,给本来性能上的缺陷又雪上加霜。
  4. 生产中心机房空间紧张,机房承重接近负荷,不能短期进行改造,同时最为严重的是电力紧缺。

    如何解决这些问题,需要找出问题的关键。经过分析,该银行灾备系统所面临的困境主要是性能方面的问题,瓶颈主要在于数据复制系统的后端存储的性能瓶颈,这种瓶颈主要原因是早期采用传统机械磁盘存储已经不能满足现有性能的要求。众所周知传统机械磁盘存储影响磁盘性能主要是I/O的服务响应时间,其中盘片旋转延迟时间、磁头寻道时间、数据传输时间几个主要因素中磁头寻道时间影响所占比重最大,机械磁盘的结构原理决定了这些问题已经是难以逾越的鸿沟。传统存储领域的解决思路是采用大量磁盘条带化处理,提高存储的并发处理能力,随之所带来了存储体积越来越庞大,占地约来越大,存储所需要的功耗越来越大,成本越来越高,机械磁盘的故障率也成比例上升等问题。

    IBM的全闪存解决方案提供了新的解决思路。针对该银行的灾备系统改造我们采用如下的方案。

通过升级数据复制设备的软硬件,提高数据复制设备的性能。

通过引入IBM Flashsystem 900 全闪存阵列,提高数据复制系统后端存储的性能。

数据复制系统的Data区,journal 区,快照区,复制缓冲区都由原来的机械磁盘存储替换为全闪存存储,全闪存存储提供后更高的I/O性能,和极低的I/O延时。不仅仅能够完全匹配主存储这种高端企业级存储的I/O能力,而且在开启多种连续数据保护功能下性能不受影响。

上线前的模拟测试数据可以说明改造后的效果。

由于测试环境的限制,全闪存阵列的性能没有完全的体现,但是从数据也可以看出,全闪存阵列比传统机械存储的性能已经有了几倍的提升。

不出所料,实际生产环境的实施后,经过一段时间的观察,效果是非常好的,拿一个数据来说明,银行每日日终交易其中 批量汇总交易的处理时长由原来的18分钟缩短为11分钟,总体日终处理时常又原来的90分钟缩短为48分钟。

IBM FlashSystem 全闪存家族有Flashsystem 900和Flashsystem v9000两款产品,本例中选择Flashsystem 900主要考虑,该设备已经满足客户的性能需要和功能需要,并且具有占用空间小,功耗低,成本低的特点。在更为复杂的应用环境中IBM Flashsystem v9000不仅仅能提供性能方面的优势,还可以提供存储虚拟化,整合异构存储环境,分级存储管理,灾难备份保障等更多的功能。真正解决问题,灵活配置,贴近用户需求,是IBM 闪存家族的竞争力体现。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广