ZTC
作者ZTC·2020-11-24 18:22
售前技术支持·浪潮商用机器有限公司

K1 Power小型机在线分区迁移功能实践

字数 3765阅读 12007评论 1赞 1

LPM 在线分区迁移功能简介

K1 Power 服务器上的分区在线迁移功能 Live Partition Mobility (以下简称 LPM )是 K1 Power 虚拟化产品家族 PowerVM 中的高级功能,包含在 PowerVM 企业版中,通过 LPM 可以将一个正在运行的虚拟机( VM )在线地从一台物理服务器迁移到其他物理服务器上。 LPM 在迁移过程中也会同时维护事务完整性并转移原有环境的:处理器状态、内存、虚拟设备和已连接的用户。 整个迁移过程全部在线完成,无需停止虚拟机或服务器 。
另外,分区在关闭时也可以进行迁移(称为非在线迁移),操作系统和应用程序必须存放在在共享存储器上。

LPM 功能的几种适用场景

1. 硬件维护

硬件维护前,可以通过 LPM 功能将需要维护的服务器上的 VM 全部迁移出去,减少计划内停机时间,提升应用系统的可用性。

2. VIOS 维护

VIOS 维护前,也可以通过 LPM 功能将需要维护的服务器上的 VM 全部迁移出去,减少计划内停机时间,增加应用可用性。

3. 负载均衡

在应用系统上线之后,由于业务压力的变化可能需要调整虚机分配的资源,当虚机所需资源超过了物理服务器的可用资源时,可以通过 LPM 将虚机迁移到资源更富裕的服务器上,从而实现在多台服务器中重新调整分区分布。

4. 服务器升级

在服务器更新换代时,可以通过 LPM 批量地将现有服务器上的虚机迁移到新购的服务器上。

LPM 在线迁移过程简述

  1. 分区配置文件(此时处于活动状态)从源复制到目标 FSP 。
  1. 配置目标上的存储器。
  2. 移动程序服务分区( Mover Service Partition , MSP )被激活。
  3. 分区迁移开始。

    a. 大部分内存页面被移动。

    b. 所有线程转为闲置状态。

  4. 激活过程在目标上恢复。

    a. 最后的内存页面被移动。

    b. 清理存储器和网络流量。

  5. 取消源上的存储器资源配置。
  6. 从源 FSP ( Flexible Service Processor )移除分区配置文件。

实现LPM 功能的先决条件

LPM 先决条件

两台启用了 PowerVM 企业版的 K1 Power 服务器上,支持 POWER6 或更新型号,一个源和一个目标。操作系统和应用程序及相关数据,必须安装和存放在共享外部存储器( Storage Area Network )上。除了这些硬件要求外,您还必须拥有:

· 一个硬件管理控制台 - HMC 。

· 目标系统必须拥有足够的资源,比如 CPU 和内存。

· LPAR 不应该拥有物理适配器。

具体要求如下:

硬件要求:

1 、 2 台 Power6 及以上服务器,如使用 Power6 服务器进行迁移,源和目标系统的微码必须在 01Ex320 或以上

2 、需要 Version 7 Release 3.2.0 (需要补丁 MH01062 )以上的 HMC 版本 , 对应的硬件型号要在 7310-CR2 以上,或者 7310-C03 以上

3 、需要 Version 7 Release 3.2.0 (需要补丁 MH01062 )以上的 HMC 版本 , 对应的硬件型号要在 7310-CR2 以上,或者 7310-C03 以上

软件要求:

  1. 要求源和目标服务器配置 PowerVM 企业版
  2. 每个源和目标系统上,都必须至少要有一个 VIOS ,其版本要在 1.5.1 或以上

用于参与分区迁移 VIOS 分区,需要标注 mover service partition ( MSP )属性 . 迁移时需要选择 MSP ,表示 VIOS 是否具有 mover 能力 . (默认情况下,所有 VIOS 分区都把这个属性设置成 false )。且源和目标服务器的 MSP ,即参与分区迁移 VIOS 分区要通过网络互相通讯

  1. 需要迁移的虚拟机操作系统可以为 AIX 或者 Linux ,其版本满足如下要求:

-AIX 5L 5.3 TL7 或者以上(要求级别是 5300-07-01 )

-AIX 6.1 或以上(要求级别是 6100-00-01 )

-Red Hat Enterprise Linux Version 5 (RHEL5) Update 1 或以上(需要 kernel security 最新)

-SUSE Linux Enterprise Server 10 (SLES 10) Service Pack 1 或以上(需要 kernel security 最新)

网络要求:

对于 Power6 和 Power7 系列服务器服务器,如果要迁移的分区是通过 VLAN 进行网络访问的,那么这个 VLAN 必须通过 VIOS 分区中的 shared Ethernet adapter(SEA) 桥接到物理网络(如果有多个 VLAN ,也都需要桥接)。 VLAN ID 必须被配置,以保证在迁移完成之后,分区还能够继续与其他的服务器进行通讯。

对于 Power8 系列服务器,如果配置了支持 SR-IOV 的网卡或 FCoE 卡,可以开启 SR-IOV vNIC 技术将逻辑网络端口分配给 VM 使用,可以无需使用 SEA 桥接。

如何发起LPM操作

1. 通过 HMC GUI 发起 LPM

通过进行 LPM 之前,需要验证源和目标两端的资源可用性。如果验证由于某种错误而失败,则需要修复错误才能继续下一步。 我们这里先跳过验证工作,直接进入发起 LPM 迁移操作。

在 HMC 界面上选择要迁移的分区,最后选择 Migrate 操作在 HMC 界面上选择要迁移的分区,选择 Migrate 操作

完成最终确认的操作菜单:

菜单窗口中将显示迁移进度,下图显示迁移成功:

在迁移过程中,我们在目标虚机上通过 FTP 连接持续产生以太网传输流量或持续对磁盘进行 I/O 操作,并通过 nmon 观察迁移过程中网络流量和磁盘 I/O 的变化情况,从 nmon 记录的结果可以看出以太网和硬盘的访问流量有一个巨大的落差,这是分区切换到另一个服务器时的“瞬断”。(实际上没有断,只是流量很少。)

2. 通过 PowerVC 发起 LPM 操作

PowerVC ™ K1 Power 服务器的高级虚拟化和云管平台,基于 OpenStack 构建而成,可针对运行在 K1 Power 服务器上的 AIX 、 i 及 Linux 虚拟机 (VM) 提供简单的虚拟化管理和私有云部署支持。

在 PowerVC 的虚机管理界面中,选择需要迁移的 VM ,点击 Migrate 。

选择在线迁移的目标机,点击 Migrate

在 PowerVC 和 HMC 上都可以查看迁移的进度 :


迁移完成后,可以在 PowerVC 和 HMC 界面上看到虚机成功迁移到目标机。


写在最后:

LPM 功能发布是在 Power6 时代发布的高级虚拟化功能,经过 10 多年的改进和提升,已经可以满足很多客户实际生产环境中的严苛要求,并有众多的用户案例。

有一部分用户只是把 LPM 当成了一种高可用的手段,用于临时应对硬件和 VIOS 维护工作。但是在维护工作完成后将虚机重新回切后发现虚拟卡的 ID , NPIV 映射关系都发生了改变,这对之前习惯通过台账记录每个分区资源分配情况的用户来说带来了诸多不便,每次 LPM 回切后都要重新更新台账信息。这里给大家分享一个 LPM 小工具: LPM Automation Tool 。相较于使用 HMC GUI 发起 LPM 操作, LPM Automation Tool 可以提供诸如批量分区迁移,分区回迁保留原映射关系等更多贴心的功能 :

LPM操作使用HMC GUI操作使用Partition Mobility Tool
批量分区迁移HMC图形界面每次只能迁移一个分区,CLI界面只支持单台目标服务器批量迁移批量迁移上百个分区,多台目标服务器,可定制分区迁移顺序
分区迁移目标人工选择目标服务器同时验证多台目标服务器,并且根据策略自动选择最佳目标服务器
分区回迁分区回迁至原服务器,无法保证配置一致,如NPIV映射关系等回迁至原服务器,保证分区及VIOS配置一致
LPM高级选项HMC图形界面只提供LPM基本选项,CLI界面迁移命令非常复杂,参数繁多支持LPM高级选项,满足复杂环境分区迁移要求
分区迁移验证无法保存验证结果,每次只能验证单台目标服务器支持多台目标服务器同时验证,导出验证结果
迁移规划建立迁移规划非常困难,需要为每个分区编写迁移命令提前建立,保存、编辑分区迁移规划,并在维护窗口中快速执行,迁移规划中包括分区迁移及回迁命令
跨HMC迁移手工建立HMC间信任关系自动完成不同HMC间建立信任关系
Enterprise Pool人工计算并移动CPU/MEM许可自动检测并按需完成移动CPU/MEM许可
DPO只能通过命令行执行DPO操作在图形界面下完成DPO评估打分、优化操作, 简便快捷

LPM Automation Tool 操作非常简单,只要在发起 LPM 操作前可以勾选是否保留虚拟槽位号和 NPIV 的映射关系,以及是否保留原有 Processor Pool 的对应关系,就可以省去您在回切后更新台账的操作。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论1 条评论

匿名用户
2020-11-25 08:42
学习了,谢谢!
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广