xuesong
作者xuesong·2021-06-30 14:20
保险行业系统架构师·浪潮商用机器有限公司

某企业核心服务器迁移技术选择

字数 1912阅读 9449评论 1赞 1

浪潮商用机器有限公司 薛松

Ÿ服务器迁移背景

目前核心系统数据库采用 Oracle 11g RAC 集群模式,部署在 2 台 HPE SD2 服务器。从监控到的交易性能数据看,日常的 TPS 约在 4000 左右, CPU 利用率接近 50% ,但在促销或开门红期间的 CPU 利用率超过 70% 。按照业务发展规划,预计 5 年的计算力需求是目前的 2 倍左右,目前的服务器资源已经不足与满足未来的业务发展。

另外,环境中支撑核心系统的 HPE SD2 服务器已经运行了 9 年左右,设备陈旧导致故障率较高,给运维带来了很大的压力。同时,随着设备退出市场,运维配件的减少,在付出不菲运维费用的同时也给生产带来的运营风险。

考虑到业务发展的需要、减少运维压力与降低运营风险,同时利用到新设备新技术的收益。企业需要更换已有老旧的 2 台 HPE SD2 小型机,并迁移支撑的 Oracle 11g 核心数据库到新环境,后端连接的 SAN 存储保持不变

可选技术与选择

目前数据库版本为较老的 Oracle 11g ,但考虑到数据库版本升级影响较大与目前版本运行稳定,故本次暂不做数据库版本的升级。因此,在服务器迁移过程中,我们将只面临两个层面的技术决策,一是服务器硬件层面,即采用什么架构的服务器替换已有的老旧 HPE SD2 服务器上;二是采用什么技术手段进行数据迁移。

服务器硬件的替换

对于服务器硬件的替换,我们将遵循兼容性满足、技术路线的稳定性、满足未来业务发展的性能要求、具备优秀的安全稳定特性,以及对业务影响最小 / 停机窗口最小的原则进行决策。具体的对比评估如下表:

如上表所示,完全同构替换的兼容性最优,表明该方案实施最简单,且对业务的影响最小,通常情况下应该是最佳选择。但从技术路线的稳定性分析看, Intel 安腾处理器后续已经不再更新, HPE SD2 的支持也只到 2025 年,这意味着 4 年后将不得不再次更换;而高端设备的使用周期一般在 7 年 -10 年之间,显然不太符合要求;同时其技术太过陈旧,也不符合业务发展的需求。同时,考虑到所支撑核心业务需求的性能最优与安全稳定特性, 经过多次的评估和测试后,最终决定采用 K1 Power 服务器替换已有 HPE SD2 服务器

数据迁移技术选择

选择适当的技术取决于要移动的数据的关键性、可用的资源以及其他业务约束和需求。不同的技术有不同的风险,需要选择能够提供迁移效率和对系统和用户低影响的最佳组合的技术。通常来说,数据迁移的技术手段主要包括基于主机的迁移、基于存储复制技术的迁移,以及基于应用的迁移。

备注:存储复制主要指硬件厂商的专有块存储设备所包含 mirror/copy 特性。

通过上表的对比分析,结合硬件异构替换的选择,最终决定采用基于 Oracle 数据库的复制技术进行数据迁移,基于 8TB 的数据量对比分析如下:

备注:上述停机窗口仅供参考,取决数据量大小, I/O 带宽,以及应用恢复时间。

通过上表对比,能很好支持跨平台的是 Data Pump (未考虑如 OGG 、 CDC 等需额外购买的复制软件),但经过验证,其停机窗口时间太长,对业务影响很大;而 Data Guard 仅支持 HPE 同架构 OS 之间的迁移。

基于目标环境 K1 Power/AIX 和源端 HPE SD2/HP-UX 都是大端的相同字节序,因此,最终选择了采用 Recovery Manager 结合日志前滚的方式进行数据迁移 。提前将已有的最新的 RMAN 备份数据恢复到目标环境,然后通过多次的增量备份或日志前滚尽量追平数据,这个过程中的源数据库是完全可访问的,业务不会受到影响。当源端和目标数据差距不大的时候,在周末晚上停止生产,恢复到最新数据,开始真正的环境切割,这样真正停机时间很短。

备注:另外可选的 XTTS 也是可以支持跨平台的免费工具,其增量复制的方式非常适合大数量的数据迁移,可以大大节省停机窗口时间,但本案例未进行实际验证。

迁移实践的总结

  1. Ÿ依据不同原则与优先级结合现状环境,选择最适合的技术或多个技术的组合。
  2. 综合考虑软硬件及已有 IT 环境兼容性或融合性,如同构 / 异构硬件替换对软件的影响,灾备架构对技术手段的影响等。
  3. 需要理解不仅仅是单纯的设备更新或数据迁移,应在迁移前做好源环境优化、迁移中的性能监控与调整、迁移后的验证与清理。
  4. 迁移前应对选择的技术手段进行 PoC ,有条件的话应进行演练。同时,应定义好回退路径,防止迁移过程中出现任何错误,可以立即返回到原始情况,从而控制迁移风险。
  5. 最后应创建完善的迁移计划,并创建检查点,确保迁移正确进行。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论1 条评论

jiangjdjiangjd系统工程师厦门翰林汇力信息技术有限公司
2021-11-29 17:21
不错,感谢分享!
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广