金融行业NAS文件系统迁移停机时长难以准确预估和控制探讨?

NAS文件系统迁移包括存量数据在线迁移+增量数据停机迁移两大步,增量数据停机迁移的时长受元数据扫描和对比所消耗的时间影响,即使最后的增量数据变化很小,也可能由于基础元数据太大而消耗很大对比时间。希望同业专家可以就此难点进行经验以及解决探讨!...显示全部

NAS文件系统迁移包括存量数据在线迁移+增量数据停机迁移两大步,增量数据停机迁移的时长受元数据扫描和对比所消耗的时间影响,即使最后的增量数据变化很小,也可能由于基础元数据太大而消耗很大对比时间。希望同业专家可以就此难点进行经验以及解决探讨!

收起
参与33

查看其它 4 个回答朱向东的回答

朱向东朱向东课题专家组高级工程师某银行

NAS文件系统数据迁移确实是一个复杂的过程,其中增量数据停机迁移的时长受元数据扫描和对比所消耗的时间影响比较大。对于这个问题,一些经验和解决方案分享如下:
1、首先要站在业务连续性视角来梳理各应用系统的关联关系,梳理NAS共享卷的挂载关系以及相互依赖关系,还有每个NAS共享卷挂载点的数据读写时间段、读写频率等,形成详细的统计分析表,可以按应用系统及重要程度为维度进行挂载卷的排序,然后跟进应用系统的维护停机窗口制定迁移计划和切换计划。
2、评估老NAS存储的性能情况及业务系统的负载情况,在新NAS存储分配新的共享卷组,然后可以使用一台专用NAS数据迁移服务器,在其上挂载老NAS存储共享卷(只读)和新NAS共享卷(可读写),可使用rsync命令从老NAS存储共享卷将数据同步到新NAS存储共享卷,并记录首次全量数据同步的耗时情况,然后可以再次使用rsync命令同步数据,并记录增量同步数据的耗时情况,将操作步骤和耗时情况登记到统计分析表中,以此类推。
3、根据增量同步数据执行耗时情况以及业务系统停机维护窗口时长,统筹分析关联系统影响情况,在变更窗口期内进行相关应用进程的停止,执行增量数据同步,同时更新/etc/fstab设置,执行umount老挂载点和mount新挂载点的操作,并验证新挂载点的读写权限,核对该NAS共享卷所有挂载点均调整完毕,检查无误后启动应用进程并做好交易验证, 然后对外提供服务。
4、由于NAS共享卷可能很多,且每个共享卷的挂载点也很多,所以可能需要开展很多个批次的变更,务必要提前沟通好各项细节,而且要做好操作培训,执行结果的核对验证,避免遗漏挂载点导致的数据不一致的情况。

银行 · 2023-08-02
浏览670

回答者

朱向东
高级工程师某银行
擅长领域: 服务器存储数据库

朱向东 最近回答过的问题

回答状态

  • 发布时间:2023-08-02
  • 关注会员:6 人
  • 回答浏览:670
  • X社区推广