1、生产中心包含应用配置、数据库配置、网络配置、全局DNS配置,生产环境一但变更如何保证所有的配置变更均已同步至灾备中心?
2、中小型金融机构若要实现灾备中心自动化演练如何进行投入产出比计算?
两地三中心配置同步是一个建设难点,最主要的是灾备端经常处于standby或者停止状态,难以验证当前的配置是否完全一致。
我们依据灾备管理系统、应用、数据库、中间件、OS的配置和CMDB,尝试建设了一个两地三中心一致性比对工具,确定关键配置,逐个建立检查和比对机制,随时进行比对并生成报表,尤其是生产环境变更之后和灾备演练前,及时进行检查。目前已经建立近百个比对项。
另外,应用发布和基础软硬件变更工单中依据CMDB自动关联灾备环境,确保灾备端完成变更,不至于遗漏。
最重要的多演练,把碰到的问题积累起来,经过解决之后再进行推广,一般的灾备演练系统经过两三每套系统五六次的演练之后,一致性的问题基本上能解决七七八八。
CMDB对数据中心内各环节的配置项进行全生命周期的管理。有CMDB至少可以保证有一份最新最准确的配置信息。
有一些不涉及不涉及应用的例如操作系统参数的修改是可以在灾备环境同步操作的。
但是真实情况很多配置修改不能在灾备中心实施,比如应用的发版如果灾备是备用的环境通常不能在生产发版的同时在灾备的环境里同步作修改;再比如网络的一些变更涉及复杂的路由路由和防火墙策略也不一定能让灾备和生产同时变更。这样启用灾备时灾备的灾备的环境和生产会存在一些差异。
因此灾备切换平台应具备这样的能力或者考虑到这些工作:即从CMDB甚至是手工维护的信息里去比对灾备没有添加上的配置,在切换前消除差异。这项工作比调度切换更繁琐也是真正见识灾切平台交付能力的地方。