容灾演练及容灾切换的问题

在IT高速发展的今天,业务也越来越依赖于IT系统,数据的重要性也毋庸置疑,因此容灾也应运而生,但就目前各大行业对容灾的建设情况来看,容灾演练有没有真正的做到位,特别是在金融、证券、保险这样的行业,如果有做容灾演练,是真演练还是模拟演练,另外,因机房出现问题造成业务中断,网络光缆被挖断的事情也时有发生,在这种情况下,为什么容灾没有即时接管,这中间又存在什么问题造成不能即时接管,请专家答疑一下,谢谢。
参与18

10同行回答

pipiluxpipilux信息技术经理中国银联
正好我团队也负责整个UP的演练管理,我来分享下演练的经验UP每年实战演练约500个,其中30-40个左右为灾备切换演练桌面演练为700个左右实战演练做好需要以下几点准备:1.领导意志:领导很重视演练,甚至觉得演练因该多做。因此“作业化演练”、”不通知演练“等名词2.专门的演练管...显示全部
正好我团队也负责整个UP的演练管理,我来分享下演练的经验
UP每年实战演练约500个,其中30-40个左右为灾备切换演练
桌面演练为700个左右
实战演练做好需要以下几点准备:
1.领导意志:领导很重视演练,甚至觉得演练因该多做。因此“作业化演练”、”不通知演练“等名词
2.专门的演练管理方,负责制定演练计划、演练报告模板、演练问题跟进、演练汇总分析优化及汇报
3.电子化的手册,我们有手册800多个,手册非纸质,均为电子平台化,因此可以和报警进行关联,并自动分配到各岗位进行执行
4.开发与运维的充分配合,重大的演练会让开发也一并参与支持
5.厂商的依赖程度,自身对厂商依赖较低,目前所有演练基本无需任何厂商支持收起
金融其它 · 2015-08-21
浏览2104
chenjianhuichenjianhui系统架构师IBM
1. 我觉得在涉及到金钱交易的场景里面,很多情况下自动切换可能只是一个技术上的可能,业务人员一定要确保主备环境之间的数据/帐务一致。如果接受数据丢失/不一致,那就要有领导下决心。2. 演练和实际现场操作是两个概念,演练有很多厂商/辅助人员参与,用户是在充分支持和冷静的...显示全部
1. 我觉得在涉及到金钱交易的场景里面,很多情况下自动切换可能只是一个技术上的可能,业务人员一定要确保主备环境之间的数据/帐务一致。如果接受数据丢失/不一致,那就要有领导下决心。
2. 演练和实际现场操作是两个概念,演练有很多厂商/辅助人员参与,用户是在充分支持和冷静的情况下进行操作的。而实际现场操作,不一定要厂商/辅助人员在场,操作人员心里紧张,操作/场景判断都比较慢。而且,实际现场操作人员,未必就是参加演练的人员。
3. 总是会出现一些不在预案里面的场景,这些场景需要现场的判断时间。
4. 如果是应用故障,那么什么系统级方案也解决不了。切换到正常的环境,还是不能排除应用的问题。收起
硬件生产 · 2015-08-21
浏览1932
arrnoxarrnox系统架构师交通银行总行软件开发中心
回复 3# perry_li 根据中心领导的要求有做定期演练,演练只是针对目前我行主机核心系统和个别小机上已经实施了双活的系统。演练的时间都是找生产交易量很少很少的时候,有几次是在半夜,演练的方法是将生产中心的机器逐个关闭,然后执行切换脚本,将所有负载切换到灾备中心。每次...显示全部
回复 3# perry_li
根据中心领导的要求有做定期演练,演练只是针对目前我行主机核心系统和个别小机上已经实施了双活的系统。演练的时间都是找生产交易量很少很少的时候,有几次是在半夜,演练的方法是将生产中心的机器逐个关闭,然后执行切换脚本,将所有负载切换到灾备中心。每次演练后都会分析RPO和RTO,RPO都是0,RTO一般在几分钟,确切说是在2分钟左右。
不过如你楼上说的,演练毕竟只是演练,和实际现场操作差异肯定会很大,其实每次演练大家已经很紧张了,真不知道实际真的生产中心发生事故会怎么样。收起
银行 · 2015-08-21
浏览1777
huixiang994huixiang994研发工程师个人
一般RTO 2分钟主要消耗在哪些环节?回复 4# arrnox 显示全部
一般RTO 2分钟主要消耗在哪些环节?

回复 4# arrnox 收起
硬件生产 · 2015-08-25
浏览1754
perry_liperry_li产品总监成都优易数据有限公司
各位分享的都很好,以后还得多学习。显示全部
各位分享的都很好,以后还得多学习。收起
互联网服务 · 2015-08-21
浏览1732
lzg21stlzg21st存储工程师brcb
回复 7# arrnox 嗯,所以这种生产和灾备硬件配置、处理能力的差异也是将来发生灾难时的一个隐患显示全部
回复 7# arrnox
嗯,所以这种生产和灾备硬件配置、处理能力的差异也是将来发生灾难时的一个隐患收起
银行 · 2015-08-21
浏览1768
arrnoxarrnox系统架构师交通银行总行软件开发中心
回复 6# lzg21st 毕竟只是演练,选在这种半夜说真的也没人希望在灾备中心跑很久再切回生产中心,一般就跑个半个小时到1个小时就切回生产中心了,而且本身我们灾备中心的处理能力连生产中心的一半都没的,真要是运行很久万一突然交易量大了就不好了。...显示全部
回复 6# lzg21st
毕竟只是演练,选在这种半夜说真的也没人希望在灾备中心跑很久再切回生产中心,一般就跑个半个小时到1个小时就切回生产中心了,而且本身我们灾备中心的处理能力连生产中心的一半都没的,真要是运行很久万一突然交易量大了就不好了。收起
银行 · 2015-08-21
浏览1829
lzg21stlzg21st存储工程师brcb
回复 4# arrnox 业务切到灾备后要运行多长时间,这个有要求吗?还是短时间内再次回切生产显示全部
回复 4# arrnox
业务切到灾备后要运行多长时间,这个有要求吗?还是短时间内再次回切生产收起
银行 · 2015-08-21
浏览1779
perry_liperry_li产品总监成都优易数据有限公司
看来政策归政策,技术归技术,终究容灾也只是一种形式,核心价值没有完全体现出来。显示全部
看来政策归政策,技术归技术,终究容灾也只是一种形式,核心价值没有完全体现出来。收起
互联网服务 · 2015-08-21
浏览1833
perry_liperry_li产品总监成都优易数据有限公司
如果生产平台上已经部署好了的容灾环境,是否有定期的容灾演练要求,又是怎么做的呢?显示全部
如果生产平台上已经部署好了的容灾环境,是否有定期的容灾演练要求,又是怎么做的呢?收起
互联网服务 · 2015-08-21
浏览1785

提问者

perry_li
产品总监成都优易数据有限公司
擅长领域: 存储软件定义存储服务器

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-08-21
  • 关注会员:1 人
  • 问题浏览:9697
  • 最近回答:2015-08-25
  • X社区推广