【核心议题2】如何通过对灾备中心的有效日常运维,来保障容灾系统的顺利切换?

因人力、成本等各种客观因素,容灾中心的日常运维标准往往不能达到生产中心的水平,下面内容讨论该从哪些方面完善容灾中心日常的运维工作:

1、数据完整性、有效性审查机制:在容灾系统中建立起与生产系统的数据同步审查机制,并通过数据核对帮助生产系统发现可能出现的问题,尤其对于选用数据库DR功能的容灾模式,要时刻关注数据库同步状态,并根据预定指标进一步检查数据的一致性、完整性,进一步完善和优化生产系统和容灾系统。

2、系统资源监控:为了保证容灾系统接管生产系统时,不会因为IT因素、基础设施问题而发生接管失败,对IT基础设施所进行的日常例行检查、维护工作。目的是帮助系统组、业务组成员对生产系统及其容灾系统的运行情况进行监控,对故障进行快速准确定位。

3、软件版本管理:在软件版本进行变更、升级过程中,要及时对生产系统及其容灾系统的软件版本进行管理,保证容灾系统能按既定目标顺利接管业务,避免由于版本不一致造成的数据错误、业务接管失败。

4、容灾变更管理:严格控制、管理容灾系统中的变更行为,确保容灾变更平稳实施。严格审查发起,影响及资源评估、接受、执行、变更总结等。


除以上提到的四个方面来完善容灾中心日常的运维工作外,你认为还有哪些其他的方面?欢迎分享!

参与17

4同行回答

pysx0503pysx0503系统工程师第十区。散人
     很多时候。企业对容灾的重视程度决定了容灾中心能否有效健康的运行,在突发事件时候起决定性作用。     更多的时候。企业对于容灾中心的态度就并不是过于重视,把容灾中心完全的推给运维,而并没有把有效的资金,人力,执行力持续的...显示全部

     很多时候。企业对容灾的重视程度决定了容灾中心能否有效健康的运行,在突发事件时候起决定性作用。

     更多的时候。企业对于容灾中心的态度就并不是过于重视,把容灾中心完全的推给运维,而并没有把有效的资金,人力,执行力持续的投入到容灾中心中。导致容灾中心虽然建立。建立的初期 也一切运行正常。但慢慢的开始投入不足。人员不足。容灾中心开始无法与数据中心保持高度的一致和同步。没有足够的人员进行运维,巡检。在突发事件的时候,没有有效的执行力调度所有部门配合,而更多的是应用部门的抱怨和只能部门的不断催促,导致容灾中心运行多年到真正发挥时间无法正常运行。

      容灾也好,数据备份也好,我觉得都和买保险一样。很多企业觉得这个保险的费用太高了。所以更多的时候选择不买,靠运气,靠运维。真正让企业的信息管理部门重视数据的重要性,才会让他们下定决心去支持容灾中心的建立和制度的完善。

收起
系统集成 · 2017-03-29
浏览2696
LaozhaoLaozhao其它cs
1、建立完整的组织体系(可以是虚拟的),分工要求明确。2、灾备日常管理员必须得到上层领导授权。3、严格的变更评审机制(每一个关系到灾备系统的变更必须经过灾备管理审批,一旦确认于灾备有关,必须同步启动灾备中心变更)。4、严格执行演练手册的变更和版本控制;(在涉及到灾备相关...显示全部

1、建立完整的组织体系(可以是虚拟的),分工要求明确。

2、灾备日常管理员必须得到上层领导授权。

3、严格的变更评审机制(每一个关系到灾备系统的变更必须经过灾备管理审批,一旦确认于灾备有关,必须同步启动灾备中心变更)。

4、严格执行演练手册的变更和版本控制;(在涉及到灾备相关系统的变更时,灾备日常维护人员必须注意演练手册的更新升级)

5、定期的组织学习,以及推演(这个很重要,能在过程中发现很多问题)。

6、定期组织真正的演练。

7、演练完成后一定要总结,并更新演练手册。

收起
政府其它 · 2017-04-01
浏览2302
LINE2008LINE2008系统工程师北京北鹰吉成科技有限公司
切换演练也是必不可少的啊显示全部

切换演练也是必不可少的啊

收起
互联网服务 · 2017-03-31
浏览2346
haizdlhaizdl技术经理大连
以数据库复制架构为例:1. 日常检查(主备库状态、主备库切换状态、主备库日志同步情况、主备库是否有GAP、主备库警告日志、主备库负载情况等等)。2. 容灾技术准备检查(容灾切换手册或者工具有效性检查、环境变化检查、容灾技术体系完善性检查)3.监控检查(容灾决策依据的监控点...显示全部

以数据库复制架构为例:

1. 日常检查(主备库状态、主备库切换状态、主备库日志同步情况、主备库是否有GAP、主备库警告日志、主备库负载情况等等)。

2. 容灾技术准备检查(容灾切换手册或者工具有效性检查、环境变化检查、容灾技术体系完善性检查)

3.监控检查(容灾决策依据的监控点是否可用、是否有异常等等)

4.应急机制(流程、工具、人员有效性)

收起
银行 · 2017-03-31
浏览2368

提问者

qq373793057
系统工程师某银行
擅长领域: 存储灾备分布式系统

问题来自

相关问题

相关文章

问题状态

  • 发布时间:2017-03-28
  • 关注会员:5 人
  • 问题浏览:6764
  • 最近回答:2017-04-01
  • X社区推广