chinesezzqiang
作者chinesezzqiang2017-12-15 11:00
信息技术经理, M

PowerVM虚拟化中Lpar的动态迁移

字数 5760阅读 5806评论 1赞 8

本文作者: 张志强


摘要

在IT技术快速发展的今天,虚拟化技术日趋成熟,由于其在资金节省和IT效率提高上的优势日益明显,越来越多的企业也开始部署虚拟化平台。鉴于IBM Power平台杰出的稳定性和运算性能,所以越来越多的重要应用已经迁移到Power平台上运行,为用户提供可靠的服务。为了提高业务的连续性,防止由于物理Power停机维护,硬件更换带来的停机窗口,本文将针对IBM PowerVM环境中的Lpar进行动态迁移进行讲解,实现服务的连续性和避免停机窗口对业务的影响。本文介绍如何配置动态分区迁移(LPM)并对其进行故障诊断。还简要解释了一些 LPM 基础概念。主要有以下几个主要内容。

  • 简介
  • LPM的规划
  • LPM环境的部署
  • LPM的配置
  • LPM的测试

一、简介

1、背景介绍

由于虚拟化在资金节省和IT效率提高上的优势日益明显,越来越多的企业也开始部署虚拟化平台,并将大部分业务迁移到虚拟化的平台。通过虚拟化技术提供的各种高级特性,如动态迁移、快速部署、资源动态迁移等功能保证业务的连续性和稳定性。针对这样的发展趋势,项目采用IBM领先的虚拟化技术PowerVM实现服务器虚拟化,并运用最新的PowerVM特性之一--Live Partition Mobility,在机器硬件需要升级和维护的时候,来实现业务的连续性运行,保持较高的SLA (Service Level Agreement)。

2、LPM介绍

LPM是 IBM 基于 POWER6 技术提供的新特性,它特指将运行 AIX 或 Linux 操作系统的逻辑分区从一台物理系统迁移到另外一台完全不同的物理系统的过程。在这个过程中,操作系统和应用程序不受任何破坏,对外提供的服务也不受任何影响。

动态分区迁移(Live Partition Mobility,以下简称 LPM)给予管理员更加灵活的控制职能,当逻辑分区所在的系统需要进行硬件升级或者维护的时候,又不想因为维护而将服务停止,就可以利用LPM功能将它先迁移到另一台物理系统上,待升级或维护完成后,再将逻辑分区迁移回来。随着业务的发展,逻辑分区上的工作量可能会越来越大,这时可以利用 LPM功能将逻辑分区迁移到资源更多的物理系统上,以提供更优质的服务,达到一个负载均衡的目的。

3、LPM的术语和原理

要应用和配置LPM特性就必须先了解一下LPM中所涉及的常用术语和迁移原理。

1.png

1.png

图1-1 LPM 工作原理

理解LPM的工作原理对于成功的规划和部署Lpar迁移至关重要。其工作原理如图1-1所示:
1、分区配置文件(此时处于活动状态)从源复制到目标 FSP。
2、配置目标上的存储器。
3、移动程序服务分区(Mover Service Partition,MSP)被激活。
4、分区迁移开始。
A.大部分内存页面被移动。
B.有线程转为闲置状态。
5、激活过程在目标上恢复。
A 最后的内存页面被移动。
B 清理存储器和网络流量。
6、取消源上的存储器资源配置。
7、从源 FSP(Flexible Service Processor)移除分区配置文件。

完成上述步骤之后,原来的主机资源将被顺利移动到目标主机继续提供服务。

4、名词解释

活动分区(Mobile Partition):被迁移的逻辑分区。
源系统(Source System):活动分区原来所在的系统。
目标系统(Target System):活动分区将要被迁移到的系统。
VIOS(Virtual I/O Server):即虚拟 I/O 服务器。是一个安装了特殊定制的 AIX 操作系统的逻辑分区。它可以将各种物理资源转化为虚拟资源,从而使得各个逻辑分区通过 VIOS 来共享这些物理资源。
HMC(Hardware Management Console):即硬件管理平台。用来管理一台或多台系统的平台,它有自己独立的硬件。用户可以通过 HMC 的可视化界面或命令行对逻辑分区和系统等进行一系列的管理工作。
FSP(Flexible Service Processor):Power 服务器中用来管理主机硬件的板卡,系统插电后 FSP 即开始工作。该板上有插口用于将系统连接到 HMC 网络。可以通过 ASMI(Advanced System Management Iterface)控制 FSP 进而执行电源重启、查看系统信息等操作。
MSP(Mover Service Partition):即移动服务分区。VIOS 的一个系统设置,由它控制是否允许迁移逻辑分区的状态。
RMC(Resource Monitor and Control):RMC 是一个分布式的框架和体系结构,它允许 HMC 和被管理的逻辑分区进行通讯。

5、LPM的分类

标准的 LPM 过程是由验证操作和迁移操作两部分组成的。即:

验证操作(Validation):验证是进行 LPM 之前可选的一步操作,它可以帮助用户检查环境是否已经准备就绪。验证操作提供的错误信息和警告信息可以帮助用户及时修正错误,以保证迁移过程的顺利进行。
迁移操作(Migration):由 HMC 或 IVM 提供的功能。使用迁移操作,可以完成活动分区从源系统到目标系统的动态分区迁移。
LPM 按照逻辑分区的情况分为下面两种类型的迁移:
非活动迁移(Inactive Migration):被迁移的逻辑分区是断电的。在参考资料中称为非活动迁移
活动迁移(Active Migration):被迁移的逻辑分区是不断电的,且一直对外提供服务。
在迁移过程中逻辑分区能继续提供服务,不会影响用户行为。在参考资源中称为活动迁移LPM 按照系统的管理方式分为下面两种类型的迁移:
HMC 之间的动态分区迁移:逻辑分区使用 HMC 管理的 LPM。
IVM 之间的动态分区迁移:逻辑分区使用 IVM 管理的 LPM。

二、LPM的规划

在文章所描述的架构设计中,两个Power主机分别规划出两个分区,一个用于VIOS,一个用于数据库安装。两个VIOS共享一个存储区域,并将共享区域划分给相关的Lpar使用。通过HMC操作实现Lpar的动态迁移。

所有硬件均采用IBM Power 740+服务器、V7000存储设备和HMC。

1、硬件列表

表1:服务器配置表

机型角色说明
Power 740+Lpar主机承载多个虚拟机

表2:存储

机型角色说明
V7000数据存储存储硬盘数据

表3:硬件管理控制台

机型角色说明
HMC管理power主机实现LPM

2、部署架构图

2.png

2.png

图2-1 LPM架构图

三、LPM环境的部署

1、LPM的先决条件

主要准备过程包括以下若干方面:

源系统和目标系统的 FSP 的设置。具体包括:
(1)Power VM 企业版代码已被激活
(2)逻辑内存块的大小相同
管理源系统和目标系统的 HMC 或 IVM 满足如下要求:
(1)HMC的硬件支持LPM功能
(2)HMC和IVM 的操作系统版本支持LPM功能
(3)远程的HMC和IVM 之间已建立密钥认证(如果主机位于不通的HMC或者IVM中)
源系统和目标系统的设置。具体包括:
(1)源系统和目标系统使用Power 6或者更高版本的硬件
(2)源系统和目标系统的管理方式相同,即都使用HMC或都使用IVM进行管理
(3)源系统和目标系统的Firmware版本支持LPM功能
(4)目标系统上有足够闲置的内存和处理器用来支持LPM功能
源VIOS和目标VIOS满足如下要求:
(1)VIOS的版本支持 LPM 功能
(2)启用 MSP 功能(冷迁移无此要求)
(3)时钟同步(冷迁移无此要求)
活动分区满足如下要求:
(1)运行的操作系统支持LPM功能
(2)RMC连接已建立(冷迁移无此要求)
(3)关闭冗余错误路径报告功能
(4)虚拟串行适配器(Virtual Serial Adapter)不得多于 2 个,即只能通过 HMC 或 IVM 取得对活动分区的虚拟终端连接
(5)不能使用大页内存(Huge Page)
(6)不能使用物理或专属的 I/O 设备(冷迁移无此要求)
外部存储满足如下条件:
(1)源系统和目标系统连接相同的 SAN 存储
(2)将整块的 SAN 存储以虚拟磁盘的形式分配给活动分区
(3)SAN 逻辑单元的 reserve_policy 属性置为 no_reserve
(4)目标系统上有足够的虚拟插槽(Virtual Slot)
网络配置满足 :
(1)源 VIOS 和目标 VIOS 配置共享以太网适配器
(2)活动分区使用虚拟网卡

2、划分Lpar

所有的服务都是通过Lpar的方式提供。这样可以充分利用Power VM虚拟化的优势和特有功能来按需分配和提供所需的性能和计算能力。CPU和内存方面不用过多的设置,按照0.8和8G的标准。通过HMC按照下表标准,创建一个Lpar。
Lpar的具体创建方法可以参考IBM 红皮书(www.redbooks.ibm.com)。

表4:LPAR配置表

处理器内存硬盘网卡
0.8(shared)8G30/50Eth0

3、划分存储
由于LPM要求所有的盘必须从共享的存储上供给才能实现迁移。所以本次试验,将启动盘和数据盘均放在共享存储上。
通过V7000提供的控制界面,划分两个LUN作为启动盘和数据盘分别映射给两个不同的VIO。

3.png

3.png

图3-1 划分共享存储

四、LPM的配置

1、配置VIOS

通过VIOS发现之前划分的存储,可以通过oem_setup_env下的cfgmgr来发现。此命令分别在不同的VIOS上执行。

4.png

4.png

图4-1发现存储

从上图可以看出,hdisk5和hdisk6就是我们之前所划分的两块存储。其中hdisk5为启动盘,hdisk6为数据盘。为了可以在多个VIOS中共享存储,需要提前改变hdisk的属性为reserve_policy=no_reserve。

5.png

5.png

图4-2 变更磁盘属性

为了实现迁移,我们需要将各个VIOS的 MSP(Mover Service Partition)功能启用。当然如果是冷迁移的话,是可以不启用的。

6.png

6.png

图4-3 激活MSP功能
如果想让Lpar识别到之前划分的存储,需要在VIO中做相关mapping。进入其中一个VIO服务器,进入到配置模式(oem_setup_env)。通过如下命令,将hdisk5和hdisk6分别映射到vhost0和vhost15,作为lpar的系统盘和数据盘。

7.png

7.png

图4-4 映射磁盘

2、配置Lpar

选择上述VIO所对应的lpar,添加两个Client SCSI适配器如图4-5所示。通过这两个vscsi来连接VIO中刚分配的两块磁盘,分别作为启动盘和数据盘使用。通过HMC勾选预添加的Lpar ,选择 manage profiles,点击virtual adapters,添加client scsi31和51。

8.png

8.png

图4-5 添加虚拟适配器

对于目标VIO只需要在Lpar和VIO中划分相关的vSCSI,用于连接两块磁盘,此处添加为client scsi 43和63。至于mapping关系将由迁移动作完成。

9.png

9.png

图4-6 添加虚拟适配器

部署操作系统和应用到VIO1的两块硬盘,详细步骤可以参考IBM的官方文档。(地址详见参考资料)。

五、LPM的测试

1、验证迁移过程

进行 LPM 之前,需要验证源和目标两端的资源可用性。如果验证由于某种错误而失败,则需要修复错误才能继续下一步,否则可能会影响后面的迁移过程。

10.png

10.png

图5-1 验证迁移

验证屏幕(如图 5-1 所示)显示,依次执行勾选Lpar,选择Operations---Mobility---Validate以便从一个主机迁移到另一个物理主机 。
在如下的迁移窗口需要确认源主机和目标主机,如果是跨HMC的,需要额外指定HMC信息。

11.png

11.png

图5-2 填写目标主机

此时系统将进行迁移前的验证工作,如果没有错误发生,就可以执行实际的迁移工作。

2、迁移

在HMC中选择预迁移的lpar,依次选择Operations---Mobility--Migrate,如下图所示

12.png

12.png

图5-3 执行迁移
如无错误,将显示5-4的迁移过程,此时需要做的就是默默的等待。在此过程中,业务连续性不会被破坏,不会终止用户的访问,如图5-4所示。

13.png

13.png

图5-4 Ping操作

14.png

14.png

图5-5 迁移过程

六、总结

本文介绍了如何通过IBM Power VM中提供的高级功能LPM实现活动分区的动态迁移的方法和原理。通过LPM的建立和实施,可以降低硬件维护成本,实现业务的无缝迁移。特别指出一点,LPM 并不是一个高可用性或灾难恢复解决方案。其主要设计目标是在预定的维护活动期间保持应用程序状态良好且正常运行。

参考资料

IBM网站为Power产品和虚拟化技术提供了丰富的文档资料,用户可以从以下的链接中获得详细帮助信息。

  1. IBM Power VM Best Practices
    http://www.redbooks.ibm.com/Redbooks.nsf/RedbookAbstracts/sg248062.html
  2. IBM Power System HMC Implementation and Usage Guide
    http://publib-b.boulder.ibm.com/abstracts/sg247491.html
  3. IBM PowerVM Virtualization Introduction and Configuration
    http://www.redbooks.ibm.com/abstracts/sg247940.html?Open
  4. IBM Live Partition Mobility Preparation Checklist
    http://www.redbooks.ibm.com/abstracts/tips1185.html?Open

作者简介:

张志强
有数年的IT服务工作经验,曾分别任职于国内大型IT企业及世界级五百强企业,拥有丰富的IT系统集成经验,虚拟化部署和管理经验(如PowerVM、KVM、VMware、Hyper-V)及相关IT管理经验。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

8

添加新评论1 条评论

wuwenpinwuwenpin软件开发工程师, 南京
2019-01-10 14:08
感谢分享!
Ctrl+Enter 发表

本文隶属于专栏

新品解读
不同的趋势领域,总会不断有新的产品进行发布。但是新的产品价值如何结合用户需求被解读出来,让更多的企业用户迅速建立对产品优劣势的价值了解。能够把企业群体的需求进行抽练,并且同时让产品的价值对接后还能通俗易懂的解读出来,作者往往不是来自某一个人,而是一个团队。

作者其他文章

相关文章

相关问题

相关资料

X社区推广