私有云平台华为存储资源池切换演练?

私有云平台采用多台华为服务器和多台华为存储。多台华为存储搭建了OSS云平台对象存储资源池,用于给云服务器ECS分配数据盘以及存储海量数据。异地有完全一致的灾备私有云。切换演练时模拟本地华为存储OSS宕机,如何把多台华为存储构建的OSS存储资源池进行整体切换。因为异地二百公里,存在数据差。该如何保障私有云平台切换既能贴近真实情况,又能保证切换安全?切换步骤又是怎样的?

参与4

1同行回答

朱向东朱向东课题专家组高级工程师某银行
这是一个涉及面较广且比较复杂的问题,我个人理解,楼主在建设私有云平台的初期,应该是已经考虑到私有云平台以及OSS对象存储的跨中心容灾方案,否则异地不会有完全一致的灾备私有云。那么,无论是ECS还是OSS应该已经在建设初期就实施并设置了双中心数据复制的策略,就生产和异地之...显示全部

这是一个涉及面较广且比较复杂的问题,我个人理解,楼主在建设私有云平台的初期,应该是已经考虑到私有云平台以及OSS对象存储的跨中心容灾方案,否则异地不会有完全一致的灾备私有云。
那么,无论是ECS还是OSS应该已经在建设初期就实施并设置了双中心数据复制的策略,就生产和异地之间相隔二百公里,有数据差是必然的。因此,在切换演练前需要对数据复制策略进行核对,并确定实际的数据差量,以及完成一致性数据同步所需要的时长。
就双中心切换而言,真实灾难切换必定是要丢部分数据的,在演练场景下则要尽可能的降低演练给业务系统中断带来的影响,还要确保从生产切换到异地,再从异地回切生产的过程中数据不丢失,切换后和回切后业务系统能正常运行。
若仅仅是贴近真实情况的私有云双中心切换,首先,要全量重新审视私有云容灾建设方案,对其承载的业务系统进行关联性分析,对网络质量进行重新评估,一是从业务层对所有涉及的业务系统层面的切换步骤进行梳理,对所有的业务系统切换脚本进行测试验证。二是从私有云平台层对ECS或OSS基础底座的切换步骤进行梳理,并测试验证其切换脚本。三是对DNS域名相关的切换方案与切换脚本进行验证。然后,总结梳理情况和测试情况,评估切换和回切的可行性以及耗时情况,一是撰写切换演练总体方案和分时操作步骤表,二是撰写给相关部门的备案材料,三是在正式切换演练之前要选多个窗口进行局部的小范围的实际切换验证。最后,确定最终的切换演练日期,一是完成给相关部门报备,二是邀请相关厂商重保,三是按照既定时间进行正式的切换演练,四是对演练过程进行记录和总结,形成分析报告和后续整改计划。

收起
银行 · 2023-01-16
浏览336

提问者

sunnybaofeng
系统运维工程师某城商行
擅长领域: 存储云计算容器云

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2021-09-28
  • 关注会员:2 人
  • 问题浏览:1052
  • 最近回答:2023-01-16
  • X社区推广