活动简介
先谈谈几个概念:
灾难:由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受且达到特定时间的突发性事件,通常导致信息系统需要切换到备用场地运行。
灾难恢复:为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
灾难恢复预案:定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件,用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。
灾难备份中心/备用场所:用于灾难发生时接替生产系统运行进行数据处理和支持关键业务功能运作的场所,包括备用数据处理中心、备用的工作环境、备用生活设施和技术支持及运行管理人员。
为了应对灾难事件的发生,国家和行业监管机构相继发布了一系列法律法规。
2003年9月,中共中央办公厅、国务院办公厅转发了《国家信息化领导小组关于加强信息安全保障工作的意见》(中办发[2003]27号)。该指导意见明确提出:国家和社会各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。灾备建设要从实际出发,提倡资源共享、互为备份。
2004年1月9日,全国信息安全保障工作会议下发了《关于做好国家重要信息系统容灾备份工作的通知》。明确指出国家重要信息系统容灾备份工作的主要目标是“提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严重中断,保障社会经济的稳定”。
2007年11月1日,国家正式下发了《信息安全技术信息系统灾难恢复规范》(GB/T 20988-2007)。规范指出:要加快实施八个重点行业(银行、电力、铁路、民航、证券、保险、海关、税务)的灾难恢复工作。
2006年4月19日,人民银行下发的〔2006〕123号文件《中国人民银行关于进一步加强银行业金融机构信息安全保障工作的指导意见》,明确要求银行业信息系统灾难恢复应遵循的管理要求。
2009年6月,银监会发布《商业银行信息科技风险管理指引》 ,明确要求: 商业银行应根据自身业务的性质、规模和复杂程度制定适当的业务连续性规划,以确保在出现无法预见的中断时,系统仍能持续运行并提供服务;定期对规划进行更新和演练,以保证其有效性。
2008年3月,中国保险监督委员会下发《保险业信息系统灾难恢复管理指引》,明确中国保监会负责对保险业信息系统灾难恢复工作实施监督和管理。
2010年 银监会发布《商业银行数据中心管理办法》,明确要求:省级分支机构数量在5个(含)以上,资产规模一千亿元人民币以上的法人商业银行,及省级农村信用联合社应建立异地模式灾备中心,信息系统灾难恢复能力应达到《信息安全技术-信息系统灾难恢复规范》(GBT/T 20988-207)中定义的灾难恢复等级第5级(含)以上;
2011年4月,中国证监会发布了《证券期货经营机构信息系统备份能力标准》(JR/T0059-2010),对信息系统备份能力提出了基本要求和标准。
2016-11-07通过了 《中华人民共和国网络安全法》在法律中提到,关键信息基础设施运营者必须要“对重要系统和数据库进行容灾备份”,保护数据安全的需求促进了国内外容灾备份市场的发展
那么从灾备行业的发展来看,灾备行业经历了几个阶段
第一阶段:整个灾备行业的起源应该是在70年代,1979年,SunGard在美国费城建立了全世界第一个灾备中心,当时大家关注的主要就是企业IT这一块,比如数据备份和系统备份等;
第二阶段:IT备份发展到了灾难恢复规划(DRP),在IT备份中加入了灾难恢复预案、资源需求、灾备中心管理,形成了对生产运行中心的保障概念;
第三阶段:人们把灾难恢复从IT角度逐渐转向了业务的角度,用业务来衡量灾备目标:哪些业务最重要?哪些业务可容忍的恢复时间最短?除了IT支撑之外,灾备中加入了业务影响分析、策略制定、业务恢复预案、人员架构、通信保障、第三方合作机构等,成为了业务连续性规划(BCP)
从灾备中心的建设模式来看,也同样经历了几个阶段
第一阶段:单一灾备中心的建设,同城灾备建设,异地灾备中心建设
第二阶段:分发模式灾备中心的建设,也就是俗称两地三中心或者多地多中心的建设
第三阶段:双活数据中心的建设,整合共享数据中心的建设模式
从灾备中心的建设模式的发展历程上我们可以发现,双活数据中心的产生的最主要原因一是业务连续性要求,另外一个就是合理利用数据中心资源的需求。因为我们知道,建设一个数据中心,所需要花费巨大的资金,运维一个数据中心也同时要投入巨大的人力资源。那么仅仅只为了灾备,而建设数据中心,并且部署与生产中心类似的资源,所消耗的成本和价值产出是不匹配的。那么如何更好的利用灾备数据中心呢,双活数据中心的提出,可以很好的解决这个问题。那么双活数据中心实际上也提出了很多年,早期采用最多的方式是两个数据中心运行不同的业务,同时两个数据中心互备业务数据。这样的方式是技术简单,可以更好的利用数据中心的资源。但是同时也存在一些问题,例如这种非对称工作负载的双活数据中心只解决了数据中心利用率的问题,业务快速接管,业务连续运行还做的不够完美,原因是灾备的手段还是已主从模式为主,主中心平时承载业务运行,备中心实时或定时获得数据,平时并不承载业务运行,当灾难发生灾备中心需要接管运行的时候,还需要执行切换的一系列操作,对于前端用户的访问还是有感知的。那么为了更好的实现国标中灾难恢复等级6的要求,实现零数据丢失,实现远程集群部署,对称工作负载的双活数据中心的解决方案出现了。理想化的对称工作负载的双活数据中心实现是非常困难的,需要应用层,计算层,存储层,网络层等多方面,多维度的支持。目前传统企业IT架构上实现对称工作负载双活数据中心的成功案例并不多,因为受到一些方面的限制,例如应用层的访问关系是否支持,跨数据中心网络的健壮性问题,数据持久化层数据一致性如何保证等等问题。同时双活数据中心已经不区分生产中心和灾备中心,双中心同样承载业务运行,对运维以及人员配置提出了新的要求。
双活中心的架构模式实际上已经出现了很长一段时间了,为什么完全意义上各个技术层面实现双活的对称工作负载的双活数据中心案例并不多见呢,原因有技术上的一些列瓶颈,运维的一系列压力,投入成本的巨大等等方面,所以现在更多的一种选择是非对称双活数据中心的架构模式,既能合理利用数据中心资源,又能达到一定的业务连续性要求。
本次讨论想从两个角度谈一下双活数据中心的必要性,以及双活数据中心建设中存储层面存储双活的必要性。实际业界在如何建立双活数据中心一直存在争议,那么我们可以借此机会深入探讨一下
1. 双活数据中心建设有没有必要?
2. 双活数据中心架构是否是保障业务连续性的终极形态?
3. 云计算中心的普及,双活数据中心是否还有建设的意义?
4. 如何建设实用型的双活数据中心?
5. 存储双活的技术实现及相关产品特性分析?
6. 存储双活有多少隐患和风险?
7. 存储双活实际能产生多大价值?
8. 分布式架构的引入是不是传统存储双活的末日?
9. 分布式存储和传统存储如何能够互补?
10. 分布式存储是否也可以实现存储双活?
嘉宾介绍
张鹏 数备中心技术总监 中国金融电子化公司
目前在中国金融电子化公司担任数备中心技术总监一职,2012年获得AIX高手挑战赛全国赛总冠军,主要负责数据灾备中心的存储架构设计,灾备解决方案体系建设。从业十多年一直致力于存储备份、UNIX领域的知识积累,对存储备份、UNIX领域中某些方面有独特的见解。并担任《存储架构师》杂志专家顾问。