金融行业灾备系统建设--你不是一个人在战斗!

既然是研讨会,那就是研讨,就是说话,就是唠嗑,也就不需要再准从什么八股行文要求,就是随便聊聊,茶已泡好,那就开始啦。

一、不是一个人在战斗

其实这几年从监管乃至到银行,其观念都已经或多或少有所改变,信息系统的安全稳定运行也不再是科技部门一个部门的事情,首先我们一起来看银监会这五年出台的监管要求:

1、2008年出台的《银行业重要信息系统突发事件应急管理规范》;
2、2010年发布的《商业银行数据中心监管指引》。

可以看出,前几年监管的关注点更多集中在信息科技本身的应急响应和处置,包括灾备恢复基础设施建设方面。但信息系统连续运行的根本目标是保证银行业务系统的连续运行进而支撑银行业务的连续运营,所以说,银行更应该从业务角度出发,以业务持续为目标,进而形成应对突发事件,以及灾难灾害发生时各部门系统作战的管理体系。可喜的是,在2011年12月,银监会颁发了《商业银行业务连续性监管指引》,对银行机构业务连续性管理体系架构、工作内容、演练等应急处置提出了明确的监管要求。更主要的,《指引》中要求商业银行应建立BCM组织框架,设立BCM的部门能从整体上协调全行其他部门,并建议该部门应为“风险部”或“办公室”等综合管理部门而非信息科技部门。 在BCM的组织框架下,业务和科技部门应作为业务连续性的执行部门,尤其是业务部门应负责设定业务恢复指标、建立业务回复资源等,强调了以业务为主体的连续性管理职能及业务部门在全行业务连续性管理建设中的义务和重要作用。

这几年银行科技部门也不再埋头苦干的单纯的致力于灾备建设,而是逐步建设建立BCP、BCM的管理体系,从全行层面建立应急响应体系,在诸如风险管理部门的牵头和组织下,和业务部门协同进行RA风险分析、BIA业务影响分析、包括业务连续性计划的制定、业务连续性演练等,包括非常必要的危机处理、舆情监督、信息沟通和发布、如何消除和降低负面影响等,都不再、也不可能只是科技部门一个人的事情。科技部门需要将业务连续运营的要求和指标,翻译成信息系统建设和运营的指标。

综上,银行不仅仅需要灾备系统建设,而需要从业务运营的层面出发,建立和完善其业务连续性管理体系,干这个活也不仅仅是信息科技部门的事情,而需要全行各级部门协同联动,合力建设、管理及持续改进,进而保障其业务系统的连续性。
参与11

0同行回答

“答”则兼济天下,请您为题主分忧!
mxinmxin资深工程师上海宝信软件股份有限公司
对于如何说服领导或者说推动高层让容灾“不是一个人在战斗”,其次还得确保体现技术的价值。海涛兄有何高见?对于平时干得辛苦,却无法在领导面前展现的众多兄弟,真的很有借鉴意义。我见过太多兄弟,一年累得郁闷加苦闷,领导却非常没有感觉,最后恨不得系统出次大故障来体现技术人员...显示全部
对于如何说服领导或者说推动高层让容灾“不是一个人在战斗”,其次还得确保体现技术的价值。海涛兄有何高见?
对于平时干得辛苦,却无法在领导面前展现的众多兄弟,真的很有借鉴意义。
我见过太多兄弟,一年累得郁闷加苦闷,领导却非常没有感觉,最后恨不得系统出次大故障来体现技术人员价值的,呵呵。收起
IT咨询服务 · 2013-07-02
浏览3831
bankerbanker技术经理中兴通讯股份有限公司
回复 9# 苏海涛     好久不见,是啊,我也很感概,主要是平时工作不能上外网,回家还得看孩子,哈哈甚是想念大家,没错,ID还是那个ID显示全部
回复 9# 苏海涛


    好久不见,是啊,我也很感概,主要是平时工作不能上外网,回家还得看孩子,哈哈
甚是想念大家,没错,ID还是那个ID收起
互联网服务 · 2013-06-29
浏览3805
苏海涛苏海涛副总经理银行
回复 8# banker banker兄,好久不见,这么多年过去了,ID依然是那个ID,倍感亲切!显示全部
回复 8# banker
banker兄,好久不见,这么多年过去了,ID依然是那个ID,倍感亲切!收起
银行 · 2013-06-28
浏览3828
bankerbanker技术经理中兴通讯股份有限公司
苏老师所言极是,尤其对于专业法规行业规范等的解读,甚是感觉受益匪浅。的确,灾备系统建设,不是一个人在战斗。显示全部
苏老师所言极是,尤其对于专业法规行业规范等的解读,甚是感觉受益匪浅。的确,灾备系统建设,不是一个人在战斗。收起
互联网服务 · 2013-06-28
浏览3885
苏海涛苏海涛副总经理银行
本来呢,按照惯例打法,这里可能还有介绍、阐述和分析现状、背景,对当前的监管指引呢,也要有一番解读,考虑到咱们这的主题还是灾备建设,故还应基于技术本身,但真的要去做好信息系统的灾备建设,一方面,确实要遵从监管要求,另一方面,弄清楚5个W的问题也确实有些必要,不仅仅是为了写方案、...显示全部
本来呢,按照惯例打法,这里可能还有介绍、阐述和分析现状、背景,对当前的监管指引呢,也要有一番解读,考虑到咱们这的主题还是灾备建设,故还应基于技术本身,但真的要去做好信息系统的灾备建设,一方面,确实要遵从监管要求,另一方面,弄清楚5个W的问题也确实有些必要,不仅仅是为了写方案、做报告或者诸多立项需求等要求促使,这里想强调的,是在灾备系统建设之前,一定要全面规划,从时间维度看,可能会包括近期、中期和远期等不同阶段,在不同的阶段,应设定不同的目标。

现在较多的建设模式“两地三中心”,大型国有银行、股份制商业银行等财力以及技术实力雄厚的,较多都是按照这个思路、朝着这个方向进行灾备系统的建设,也基本都是采用“自建”的模式,但对于中小银行而言,还是从资金投入和技术要求两个方面看,未必合适。

另一个模式就是“双中心”、“多中心”,以及“双活”,现在也有越来越多的产品、技术和解决方案可供我们利用。

还有就是是自建还是外包,外包的程度、外包的风险管理等,这对于中小银行机构而言,可能是更应该仔细考虑的问题。收起
银行 · 2013-06-28
浏览3857
苏海涛苏海涛副总经理银行
国内国外应参照的政策、标准都介绍完了,既然是这样的一个topic ,那还有这样的一个组织,就不能不提,那就是:灾难恢复国际行业协会 DRII(Disaster Recovery Institute International)1988年成立于美国,目标是建立业务连续性管理知识的通用框架,进行资质的认证,提升业务连续性管理从...显示全部
国内国外应参照的政策、标准都介绍完了,既然是这样的一个topic ,那还有这样的一个组织,就不能不提,那就是:

灾难恢复国际行业协会 DRII(Disaster Recovery Institute International)1988年成立于美国,目标是建立业务连续性管理知识的通用框架,进行资质的认证,提升业务连续性管理从业人士的专业水准。该组织制定了业务连续性管理最佳实践的10个领域,这里考过CISSP的一定会有些似曾相识的感觉,例如CISSP的10个Domain,哈哈,对了,实际上,我记得CISSP 中确实有个Domain是在说BCP,言归正传,那DRII定义的十大领域是什么呢?

1、项目的启动和管理  (说穿了就是立项,没立项就没钱、没人,没投入,没有管理层支持,一切都是空谈)
2、风险评估和控制   (这里也是我们在制定BCP过程中常说的RA)
3、业务影响分析: BIA
4、制定业务连续性策略
5、应急响应和运作
6、制定和实施BCP
7、意识培养和培训
8、维护和演练
9、公共关系和危机通信 (这点,从这次宇宙行系统事件我们可以看到,人家在说辞上称之为“系统运行缓慢”,是“慢”,不是“停”,这个概念上完全不同的,当然了,如果再进一步联系到海淀银枪小霸王的话,那就是叫“轮流发生……”,而不是“强……”,哈哈,扯远了,但这也算是公共关系和危机公关的领域和范畴内的案例吧)
10、与公共当局的协调  (这个必不可少,厂商、供应商、物业、电力、消防、通信运营商 …… ,包括ZF等等)收起
银行 · 2013-06-28
浏览3808
苏海涛苏海涛副总经理银行
既然zp_ccc  老师提到了监管,那就在这里系统说下监管相关的要求,其实最早呢,要追溯到2004~2005年, 当时是国信办牵头, 组织了包括银行\证券\电信\航空  ^ 等八个行业, 并召集了一帮专家, 经缜密和系统的讨论后, 形成了具有划时代意义的《重要信息系...显示全部
既然zp_ccc  老师提到了监管,那就在这里系统说下监管相关的要求,其实最早呢,要追溯到2004~2005年, 当时是国信办牵头, 组织了包括银行\证券\电信\航空  ^ 等八个行业, 并召集了一帮专家, 经缜密和系统的讨论后, 形成了具有划时代意义的《重要信息系统灾难恢复指南》,该文档在后续无数文档中,被尊称为《指南》,具有指南针的意义和效果。

再后来,就是国标委在2007年出了个GB/T 20998-2007 《信息系统灾难恢复规范》,紧接着,在2008年,人民银行也效仿整了个JR/T0044-2008《银行也信息系统灾难恢复管理规范》,在该时期,实际上银监会曾出台过一个《银行业金融机构信息系统风险管理指引》,并在2008年4月出台了《银行业重要信息系统突发事件应急管理规范》,这里提到了重要信息系统的概念,同时也对银行信息系统不同重要等级提出了不同的监管要求,再之后就是2009年《商业银行信息科技风险管理指引》以及2010年的《商业银行数据中心监管指引》,直至2011年12月,颁发了《商业银行业务连续性监管指引》

上述监管要求,应该囊括了银监会、人行乃至国标的所有政策和监管要求,当然,我们其实还可以参考国外的相关标准,例如,有英国标准协会的BS25999,新加坡SS540业务连续性管理标准,甚至还有香港金管局相关的规定。既然提到了BS25999,这里有两本书就一定要强烈推荐下:
BS25999-1: 《BCM实践指南》
BS25999-2:《BCM规范》
英文版和中文版现在应该都可以免费下载到,大家可以去下载阅读,看过国内很多所谓的方法论啊、书籍啊,模板啊,无不是从这两本书中提炼和参考的。

简单介绍下BS25999: 英国BSI(British Standard Institution)出台了世界上第一个关于业务连续性管理 (BCM) 的英国标准—BS 25999,该标准的目的是在最棘手和意外的情况下保证企业的业务持续运行,从而保护企业的员工、维护企业的声誉并提供持续运营的能力。该标准为在组织内了解、开发和实施业务持续性提供了基础,它包含一套基于 BCM 最佳做法的全面控制措施,涵盖整个 BCM 生命周期收起
银行 · 2013-06-28
浏览3860
zp_ccczp_ccc高级技术主管国内某金融科技公司
我也来现个丑,讲个小故事:一个房子如果窗户破了,没有人去修补,隔不久,其它的窗户也会莫名其妙地被人打破;一面墙,如果出现一些涂鸦没有被清洗掉,很快的,墙上就布满了乱七八糟、不堪入目的东西;一个很干净的地方,人们不好意思丢垃圾,但是一旦地上有垃圾出现之后,人就会毫不犹疑地抛,丝...显示全部
我也来现个丑,讲个小故事:
一个房子如果窗户破了,没有人去修补,隔不久,其它的窗户也会莫名其妙地被人打破;一面墙,如果出现一些涂鸦没有被清洗掉,很快的,墙上就布满了乱七八糟、不堪入目的东西;一个很干净的地方,人们不好意思丢垃圾,但是一旦地上有垃圾出现之后,人就会毫不犹疑地抛,丝毫不觉羞愧。
这就是“破窗定律”
  破窗定律由来
  由来: 美国斯坦福大学心理学家菲利普·辛巴杜(Philip Zimbardo)于1969年进行了一项实验,他找来两辆一模一样的汽车,把其中的一辆停在加州帕洛阿尔托的中产阶级社区,而另一辆停在相对杂乱的纽约布朗克斯区。停在布朗克斯的那辆,他把车牌摘掉,把顶棚打开,结果当天就被偷走了。而放在帕洛阿尔托的那一辆,一个星期也无人理睬。后来,辛巴杜用锤子那辆车的玻璃敲了个大洞。结果呢,仅仅过了几个小时,它就不见了。以这项实验为基础,政治学家威尔逊和犯罪学家凯琳提出了一个“破窗效应”理论,认为:如果有人打坏了一幢建筑物的窗户玻璃,而这扇窗户又得不到及时的维修,别人就可能受到某些示范性的纵容去打烂更多的窗户。久而久之,这些破窗户就给人造成一种无序的感觉,结果在这种公众麻木不仁的氛围中,犯罪就会滋生、繁荣。

  应用破窗效应不仅仅是古人所说,千里之堤毁于蚁穴,那只是吸取教训,非常肤浅,而管理强调的是成本效益、行为经济。大型的企业犹如千里之堤,人、事错综复杂,维护好千里之堤是有很巨大的成本,在实践中,当管理者面对各种不良现象时,层出不穷,这个时候谈防微杜渐是没有意义的,怎么样像纽约市交通警察局长布拉和“红牌效应”那样,扭转形势,解决破窗效应所产生的问题,保持持续改进和优化,才是管理者最重要的主题。   基本上,破窗效应带给我们的思路就是从小事抓起,只有全部小事都不出乱子,才能做大事。在应用实践中,最直观的“小事”就是环境卫生,要把一个地方搞干净1天、2天并不难,但是要一个地方持续1年365天都很干净,那就只有顶尖的企业才能做到。这些事情并不难,缺的只是下定决心、持之以恒、配套机制、形成文化、定期更新



那么我们it行业从中可以领悟到什么呢?
一个小小的风险隐患会不会导致整个系统的灾难发生呢?
It系统建设,灾备系统建设如何避免盲目的跟风效仿呢?收起
互联网服务 · 2013-06-28
浏览3794
苏海涛苏海涛副总经理银行
继续,  再看灾备建设必要性! 在项目建设前期的立项阶段,我们会有无数的理由和数据分析来阐述灾备建设乃至业务连续性建设的必要性,并向领导汇报,这里我不想赘述,就只谈一个"定律"   ---- 墨菲定律 【Anything that can go wrong will go wrong】来源是一...显示全部
继续,  再看灾备建设必要性!

在项目建设前期的立项阶段,我们会有无数的理由和数据分析来阐述灾备建设乃至业务连续性建设的必要性,并向领导汇报,这里我不想赘述,就只谈一个"定律"   ---- 墨菲定律 【Anything that can go wrong will go wrong】

来源是一个叫墨菲的空军上尉,他有一个经常会遇到倒霉事的同事。1949年的一天,墨菲开玩笑说:“如果一件事情有可能被弄糟,让他去做就一定会弄糟。”举个例子吧,比如你每天出门都带着雨伞,可总也不下雨。当你这一天不想再带伞出门时,则往往会赶上下雨。再比如你去排队买东西,窗口前有几条相同长度的队伍。这时,你所加入的队伍往往是最慢的。

这个定律告诉我们,小概率的事件是会发生的,而且发生的频率要高于我们所认知。就在最近,宇宙行的系统都挂了,这在我们的大脑中的是多么不可能的事情,但它,确实就发生了。收起
银行 · 2013-06-28
浏览3869
zp_ccczp_ccc高级技术主管国内某金融科技公司
感谢苏老师从国家法规和行业监管规范角度,给我们已提示,正如央行领导一再强调,不能局限在灾备系统如何建设,要从业务连续性全局考虑。欢迎大家发表自己的观点。显示全部
感谢苏老师从国家法规和行业监管规范角度,给我们已提示,正如央行领导一再强调,不能局限在灾备系统如何建设,要从业务连续性全局考虑。
欢迎大家发表自己的观点。收起
互联网服务 · 2013-06-28
浏览3892

提问者

苏海涛
副总经理银行
擅长领域: ipv6服务器数据中心

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2013-06-28
  • 关注会员:1 人
  • 问题浏览:9991
  • 最近回答:2013-07-02
  • X社区推广