【核心议题2】如何通过对灾备中心的有效日常运维,来保障容灾系统的顺利切换?

因人力、成本等各种客观因素,容灾中心的日常运维标准往往不能达到生产中心的水平,下面内容讨论该从哪些方面完善容灾中心日常的运维工作:1、数据完整性、有效性审查机制:在容灾系统中建立起与生产系统的数据同步审查机制,并通过数据核对帮助生产系统发现可能出现的问题,尤其对...显示全部

因人力、成本等各种客观因素,容灾中心的日常运维标准往往不能达到生产中心的水平,下面内容讨论该从哪些方面完善容灾中心日常的运维工作:

1、数据完整性、有效性审查机制:在容灾系统中建立起与生产系统的数据同步审查机制,并通过数据核对帮助生产系统发现可能出现的问题,尤其对于选用数据库DR功能的容灾模式,要时刻关注数据库同步状态,并根据预定指标进一步检查数据的一致性、完整性,进一步完善和优化生产系统和容灾系统。

2、系统资源监控:为了保证容灾系统接管生产系统时,不会因为IT因素、基础设施问题而发生接管失败,对IT基础设施所进行的日常例行检查、维护工作。目的是帮助系统组、业务组成员对生产系统及其容灾系统的运行情况进行监控,对故障进行快速准确定位。

3、软件版本管理:在软件版本进行变更、升级过程中,要及时对生产系统及其容灾系统的软件版本进行管理,保证容灾系统能按既定目标顺利接管业务,避免由于版本不一致造成的数据错误、业务接管失败。

4、容灾变更管理:严格控制、管理容灾系统中的变更行为,确保容灾变更平稳实施。严格审查发起,影响及资源评估、接受、执行、变更总结等。


除以上提到的四个方面来完善容灾中心日常的运维工作外,你认为还有哪些其他的方面?欢迎分享!

收起
参与17

查看其它 3 个回答Laozhao的回答

LaozhaoLaozhao  其它 , cs

1、建立完整的组织体系(可以是虚拟的),分工要求明确。

2、灾备日常管理员必须得到上层领导授权。

3、严格的变更评审机制(每一个关系到灾备系统的变更必须经过灾备管理审批,一旦确认于灾备有关,必须同步启动灾备中心变更)。

4、严格执行演练手册的变更和版本控制;(在涉及到灾备相关系统的变更时,灾备日常维护人员必须注意演练手册的更新升级)

5、定期的组织学习,以及推演(这个很重要,能在过程中发现很多问题)。

6、定期组织真正的演练。

7、演练完成后一定要总结,并更新演练手册。

政府其它 · 2017-04-01
浏览2266

回答者

Laozhao
其它cs
擅长领域: 存储灾备安全

Laozhao 最近回答过的问题

回答状态

  • 发布时间:2017-04-01
  • 关注会员:5 人
  • 回答浏览:2266
  • X社区推广