twt运营
作者twt运营联盟成员·2016-08-22 09:39
软件开发工程师·twt

一个针对人民银行设计的基于虚拟化的云灾备构架

字数 3417阅读 2294评论 0赞 2

人民银行重要业务系统基本完成向省分行、总行进行数据集中,各分支机构通过内联网远程访问业务系统,进行业务处理,这也带来了访问量增加、系统压力剧增的问题,业务可持续性受到极大的挑战。针对人民银行的信息系统部署与应用特点,本文设计了一个基于虚拟化的云灾备构架。大家也来看看是否合理——

原题:

云灾备技术在保障业务连续性中的应用

目前,以第二代支付系统、国库会计数据集中系统、征信查询业务系统为代表的人民银行信息系统已经在全国范围推广,对整个国家经济、金融的发展产生了深远的影响。人民银行重要业务系统基本完成向省分行、总行进行数据集中,各分支机构通过内联网远程访问业务系统,进行业务处理,这也带来了访问量增加、系统压力剧增的问题,业务可持续性受到极大的挑战。因此,灾备建设对于确保人民银行信息系统业务连续性的重要性不言而喻。

一、人民银行信息化建设的总体格局

首先,人民银行建设了总行数据中心和各省市数据中心的总体格局,即“两级数据中心”。作为全国金融信息交互的中心枢纽,人民银行总行数据中心汇集了各种重要业务系统和数据信息,负责全局性人民银行信息系统的运行。作为省域金融信息交互的核心,省级数据中心负责省域金融信息系统的运行。两级数据中心在分散和降低信息系统风险方面的优势是非常明显的:人民银行总行数据中心发生故障,省级重要业务系统可以继续处理业务;省级数据中心发生故障,不会影响全局。两级数据中心通过每天的定时任务,实现了省级重要数据的异地灾备。

其次,人民银行灾备体系已建成总行、分行(省会中心支行)、地市中心支行三级体系。总行层面,建成了“两地三中心”的灾备体系架构:总行数据中心、总行同城应急灾备中心、上海异地灾备中心。“两地三中心”的灾备架构,确保了在故障发生时对关键业务数据的保护,一定程度上保障了业务连续性。省级人民银行层面,建成了“一网两通道”灾备模式:一网指一个局域网,两通道指省级数据中心网络和同城转接中心网络。“一网两通道”的灾备体系,确保在省级数据中心网络发生故障中断时,同城转接中心接替其工作,保障了对外业务的正常运作。地市中心支行层面,建设了“一网两线路”的灾备模式:一网指一个局域网,两线路指两条专用网络线路。“一网两线路”的灾备模式确保了在一条线路出现故障后,另一条线路可以保障辖内对部署在总、分行的信息系统的访问。

二、人民银行所面临的业务连续性挑战

1.灾难性故障的影响

目前,人民银行几乎所有的涉及金融服务的业务都是通过信息系统开展,对信息系统的依赖程度愈来愈高。与此同时,灾难事件或系统故障导致的系统运行中断,从而导致业务中断的风险和威胁也越来越高。特别是诸如支付结算业务、国库收支业务、征信查询等涉及国计民生的业务,一旦发生故障影响巨大。因此,在灾难性故障发生时最大程度地保障提供信息系统服务,进而保持业务的连续性开展,设计一个合理的灾备系统,是非常必要的。

2.容灾备份能力的可靠性

目前,人民银行已经建设了本地数据级备份与异地数据备份,重要业务系统与网络设施采用了双机热备的灾备模式,但信息系统在灾难性故障发生时保障业务连续性能力还有待检验。双机热备并不能保障在主服务器因故障停止服务后,备用服务器可以立即接替主服务器即时提供服务,原因是备用服务器必须进行数据与进程环境恢复。对于人民银行信息系统而言,在灾难性事件发生时确保数据完整、网络畅通、服务不断,是检验人民银行信息系统容灾备份能力的主要目标。

三、云灾备技术

虚拟化指的是对计算机硬件或软件资源进行抽象,从而对上层应用或用户隐藏其不必了解的一些细节属性,类似于面向对象技术中的封装。对于信息化领域而言,虚拟化技术解除了服务提供者与服务使用者的紧耦合关系,服务使用者根据服务提供者提供的接口使用服务,至于服务是如何实现的,对服务使用者是不重要的。云计算是基于虚拟化发展起来的,虚拟化的云隐藏了服务提供者的细节。也就是说,对终端用户来说,他关注的是云所能提供的服务,而不需要关注服务是由云中的哪台服务器提供的。正是由于云计算的虚拟化技术分离了服务应用与服务实现,才使得无中新的信息服务得以保障。

随着云计算研究的日渐深入,作为云计算与灾备交叉技术的云灾备,为企业信息系统的容灾备份与连续运行提供了一个行之有效的解决方案。云灾备主要研究数据灾备与系统级灾备两个领域的问题,数据灾备涉及了重复数据删除与存储安全两种技术,系统级灾备则涉及了检查点和操作系统虚拟化两种技术。

在灾难故障发生时,最理想的系统级灾备由其他服务器接手故障服务器的业务,保障业务的连续性开展。为了实现故障中断时服务器中间的业务迁移,需要使用检查点技术来对故障服务器的运行状态进行拍照,然后在其他服务器上进行状态恢复。虚拟化衍生出操作系统虚拟化技术,进一步发展出基于虚拟容器的检查点技术。虚拟容器将信息系统每个进程运行的上下文环境虚拟化为一个独立的进程运行容器,实现对进程状态的拍照。进程从故障服务器迁移时,恢复这个虚拟容器就可以继续运行进程。

四、人民银行系统云灾备框架

考虑到目前人民银行信息系统的数据备份已经比较完善,进一步建设系统级灾备体系是一个趋势,以确保在灾难性故障发生时,能够迅速进行业务切换,实现业务的无间断运行。

基于虚拟化的云灾备技术的核心是数据与系统在服务器之间双向复制,数据与系统同时保存在热备服务器上,主服务器发生故障时热备服务器立即可以接手业务,当中断恢复后再还原回去:这里用到了虚拟化过程:物理服务器向虚拟机迁移(Physical Server t0 Virtualmachine,P2V)与虚拟机向虚拟机迁移(Virtual machine to VirtualMachine,V2V)。这两个虚拟化过程是可逆的,用来进行灾备恢复。

考虑到人民银行信息系统集中部署、用户地域分散的特点,可以基于虚拟化技术、中间件、路由技术设计一个兼顾云计算与云灾备的信息系统架构

715059043375027323.jpg

1.信息系统的部署与同步

每个集中部署的信息系统只对应唯一的一个IP地址,被分别部署在两个到多个数据中心中,其中一个异地灾备中心。在信息中心中为信息系统设置多台服务器,其中一台为镜像服务器。镜像服务器之间可以交换数据,也可以相互恢复;镜像服务器与主服务器之间可以交换数据,也可以相互恢复。这多个数据中心构成了服务云。

2.基于路由的服务与灾备工作原理

服务流程:终端用户根据每个信息系统唯一的IP地址访问服务器时,由服务路由中间件确定由哪一个数据中心的服务器接受访问:访问请求到达某个数据中心后,由负载均衡中间件指定由哪一台服务器(如果服务器较多,镜像服务器可以不参与指定)最终提供服务。访问完成后,提供服务的服务器根据一定的策略与镜像服务器交换数据,镜像服务器再与其他服务器(本地其他服务器、异地数据中心的镜像服务器)交换数据,以确保数据的一致性。

灾备流程:某一服务器因故障无法提供服务时,由服务路由中间件发送的访问请求将自动由负载均衡中间件指定一台正常运行的服务器(如果服务器较多,镜像服务器可以不参与指定)提供服务,同时使用镜像服务器对故障服务器进行恢复;若某一数据中心因为灾难性事件无法使用时,由服务路由中间件指定一个正常运转的数据中心提供服务,待该中心恢复正常运转后,通过同步正常运转数据中心的镜像服务器来恢复所有服务器。

3.数据同步的策略

数据同步的策略可以分为镜像服务器之间的同步和镜像服务器与主服务器同步两种,主要区分是数据同步周期不同。一般来说,镜像服务器之间的同步周期比镜像服务器与主服务器同步周期长。镜像服务器之间的同步周期可以是小时级别的,镜像服务器与主服务器同步可以是分钟级别的。该架构将云计算与云灾备结合起来,优点是很明显的。对终端用户,访问的就是一个IP地址,究竟是哪一个数据中心的哪一台服务器提供了服务,根本不用关心。对于云端而言,由于采用了服务路由中间件与负载均衡中间件,每个中心的每台服务器访问压力分散,不容易出现故障。

针对人民银行的信息系统部署与应用特点,本文设计了一个基于虚拟化的云灾备构架。其优点如上所述,但是还存在一些问题有待进一步研究。一是服务路由中间件的瓶颈问题,如果服务路由中间件不能正常工作,一旦该服务器无法正常工作,业务将中断。二是数据同步的延迟问题,如果正在进行的数据同步的数据中心出现了故障,因为同步延迟将导致数据丢失。

文章来源:《中国金融电脑》杂志

转自:金融资讯网

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广