因人力、成本等各种客观因素,容灾中心的日常运维标准往往不能达到生产中心的水平,下面内容讨论该从哪些方面完善容灾中心日常的运维工作:
1、数据完整性、有效性审查机制:在容灾系统中建立起与生产系统的数据同步审查机制,并通过数据核对帮助生产系统发现可能出现的问题,尤其对于选用数据库DR功能的容灾模式,要时刻关注数据库同步状态,并根据预定指标进一步检查数据的一致性、完整性,进一步完善和优化生产系统和容灾系统。
2、系统资源监控:为了保证容灾系统接管生产系统时,不会因为IT因素、基础设施问题而发生接管失败,对IT基础设施所进行的日常例行检查、维护工作。目的是帮助系统组、业务组成员对生产系统及其容灾系统的运行情况进行监控,对故障进行快速准确定位。
3、软件版本管理:在软件版本进行变更、升级过程中,要及时对生产系统及其容灾系统的软件版本进行管理,保证容灾系统能按既定目标顺利接管业务,避免由于版本不一致造成的数据错误、业务接管失败。
4、容灾变更管理:严格控制、管理容灾系统中的变更行为,确保容灾变更平稳实施。严格审查发起,影响及资源评估、接受、执行、变更总结等。
除以上提到的四个方面来完善容灾中心日常的运维工作外,你认为还有哪些其他的方面?欢迎分享!
很多时候。企业对容灾的重视程度决定了容灾中心能否有效健康的运行,在突发事件时候起决定性作用。
更多的时候。企业对于容灾中心的态度就并不是过于重视,把容灾中心完全的推给运维,而并没有把有效的资金,人力,执行力持续的投入到容灾中心中。导致容灾中心虽然建立。建立的初期 也一切运行正常。但慢慢的开始投入不足。人员不足。容灾中心开始无法与数据中心保持高度的一致和同步。没有足够的人员进行运维,巡检。在突发事件的时候,没有有效的执行力调度所有部门配合,而更多的是应用部门的抱怨和只能部门的不断催促,导致容灾中心运行多年到真正发挥时间无法正常运行。
容灾也好,数据备份也好,我觉得都和买保险一样。很多企业觉得这个保险的费用太高了。所以更多的时候选择不买,靠运气,靠运维。真正让企业的信息管理部门重视数据的重要性,才会让他们下定决心去支持容灾中心的建立和制度的完善。
收起1、建立完整的组织体系(可以是虚拟的),分工要求明确。
2、灾备日常管理员必须得到上层领导授权。
3、严格的变更评审机制(每一个关系到灾备系统的变更必须经过灾备管理审批,一旦确认于灾备有关,必须同步启动灾备中心变更)。
4、严格执行演练手册的变更和版本控制;(在涉及到灾备相关系统的变更时,灾备日常维护人员必须注意演练手册的更新升级)
5、定期的组织学习,以及推演(这个很重要,能在过程中发现很多问题)。
6、定期组织真正的演练。
7、演练完成后一定要总结,并更新演练手册。
收起