nkj827
作者nkj827·2020-04-05 11:08
项目经理·长春长信华天

DLPAR 的配置方法和RMC

字数 10508阅读 2378评论 0赞 17

LPARDLPAR相关

1.介绍LPARDLPAR是什么,并分析其优点

2. DLpar对于磁带机和光驱的操作

3. Dlpar配置小结

4. DLPAR的配置方法和RMC(Resource Monitoring and Control)授权和验证方式.

1.介绍LPARDLPAR是什么,并分析其优点

环境 : p-series
产品 : AIX
版本 : AIX 5L

正文 1 ,介绍
动态逻辑分区是 AIX5L 版本 5.2 提供的一项新的功能。如果编写运行于 AIX 5.2 系统的应用程序,需要了解 DLPAR 的特点并且知道应用可能受到的影响。 DLPAR 对大多数的应用不需要做任何改变,但是少部分的应用可能受到影响。应当定位这些可能的问题,提供正确的解决方案。

2 , LPAR 是什么
简单说,逻辑分区( LPAR )就是将单台服务器划分成多个逻辑服务器,彼此运行独立的应用程序。逻辑分区不同于物理分区( Physical Partitioning PPAR ),物理分区是将物理的将资源组合形成分区,而逻辑分区则不需要考虑物理资源的界限。相对而言,逻辑分区具有更多的灵活性,可以在物理资源中自由的选择部件,这需要有比较好的保证,即最大化的使用系统资源,但又最小化不必要的资源再分配。在逻辑分区的环境下,如 CPU 、内存和 I/O 都可以独立的分配给每个分区。逻辑分区的配置和管理是通过硬件管理控制台( Hardware Management Console )实现的。
对具有许多硬件资源的高端服务器而言,逻辑分区能提供许多好处,具体可以体现在以下几个方面:
1 ) 合并服务器
2 ) 同时运行生产和测试环境
3 ) 合并统一操作系统的多套版本
4 ) 合并要求不同时区设置的应用
5 ) 隔离应用程序
6 ) 灵活的工作量策略

2.1 合并服务器
当合并多套服务器成单台服务器时,可以减少系统的管理成本和物理成本,尽而减少总体
成本。在此之前,运行于多台服务器的工作量,现在可以运行于单台服务器的不同分区上,可以只有一套硬件系统管理,而且也满足于现在的物理需求,空间、电源要求等等,只用考虑 ---- 仅仅一台机器。

2.2 同时运行生产和测试环境
同一服务器的不同分区可以彼此独立运行,可以在同一服务器的不同分区同时运行生产
程序和测试程序。这可以保证让测试版本的应用程序平滑的过渡到生产应用,因为他们是
在同一硬件平台上测试的,这就减少了仅仅为了测试的要求而增加额外的机器。生产和测
试环境可以同时存在运行于同一台服务器而彼此没有接触。由于逻辑分区的存在,使几种
不同的软件或者应用程序版本运行于同一服务器成为可能。

2.3 合并统一操作系统的多套版本
从 AIX 5L 版本 5.1 开始,不同的 AIX 版本可以存在于同一硬件系统的不同逻辑分区上。
系统提供的这种能力,可以安装不同的操作系统版本,从而满足不同的应用要求。也可以
开发、测试和支持不同的版本的 AIX ,除 AIX 操作系统外,逻辑分区也支持 Linux 操作系统。

2.4 合并要求不同时区设置的应用
有许多应用程序依赖于系统时间,系统时间是由系统管理员设置的。支持不同区域操
作的应用通常是运行在不同的操作系统实例上。即使应用程序本身可以管理不同的时区,
但为计划中的维护和系统升级而不影响到区域操作,安排系统停机时间仍然是困难的。
逻辑分区使多种区域的工作量合并到一台单一的服务器。

2.5 隔离应用程序
因为逻辑分区是完全彼此独立的,所以运行于不同分区的应用程序和工作负载不会
彼此互相干扰。每一个分区的资源( CPU 、内存块和适配卡)仅仅归属于分区本身,如
果一个分区的应用程序消耗了所有分配的资源,如 CPU ,仍然不会影响到运行于其他分
区的应用,因为分区的资源是独立的。

2.6 灵活的工作量策略
对某些特定的工作负载或者应用可能会改变对资源的要求,对逻辑分区,只是简单
的再申请需要的硬件资源到需要改变资源的分区而已。同非逻辑分区的服务器相比,
显然这是很简单的,因为,这不需要硬件资源的升级来匹配这种资源的改变。

3 ,动态逻辑分区( DLPAR )是什么
在单台服务器上管理、协调工作量,逻辑分区给我们提供许多灵活性,因为我们可
以将单台服务器划分成多台逻辑服务器,而且每台逻辑服务器都具有自己的资源,然
而,逻辑分区也有些限制,如要增加或删除资源,必须停止逻辑分区的运行,然后重
新引导分区。
动态逻辑分区,则消除了以上的局限,例如, AIX 5.2 具有动态增加、删除资源的
能力,可以动态的增加、删除 CPU 、内存和适配卡,而不用重新启动机器。动态逻辑
分区,具有逻辑分区的所有优点,又增加了动态改变系统资源使用的能力。

动态逻辑分区的优点
在动态逻辑分区的环境下,给我们提供了更大的灵活性,硬件资源可以按需分配,
以下详细列举动态逻辑分区的优点:
1 ) RAS ( reliability, availability, serviceability )性能进一步得到提高。有故障的 CPU 可以动态删除,另外动态逻辑分区组合 CUoD 是 CPU 可动态备份,故障的 CPU 可以
被后备的 CPU 透明的替换。
2 ) 升级 PCI 系统主板(带热插拔功能),升级可不需重新启动而又不影响其他的分区
3 ) 转移系统资源到最需要的分区中。例如,应用程序如耗尽 CPU 资源,另外的 CPU 可以动态的分配到此分区
4 ) 通过 CUoD 功能可动态的激活并使用资源,这些后备的资源,可以在系统管理员认为机器需要更多的处理能力时激活使用,而这些后备资源可以在客户确定要激活时才付费。
5 ) 安装新的操作系统,以供测试。为了使应用可以跟踪操作系统的更新,可以创 建新的分区,供测试使用。为获得足够的资源,动态逻辑分区使得从运行中的分区释放资源变得更加容易。
6 ) 再分配 I/O 设备,如光驱、带机。这些设备可以很快又容易的从一个分区再分配到另一个分区以供安装、备份等用。
7 ) 在系统运行的高峰时刻,可以在分区之间移动 CPU ,内存,高峰过后则可将这些资源重新转移回去。
8 ) 维护一个空闲的资源池( CPU 、内存和 I/O ),因而新创建的分区可以比较简单的从空闲池中获取资源。

4 ,总结
LPAR 和 DLAPR 是 AIX 5L 提供的一项新的功能。任何运行 AIX 5.2 操作系统的逻辑分区都
支持动态逻辑分区。当升级操作系统从 AIX 5.1 到 AIX 5.2 时,没有必要为了使用动态逻辑分区而升级所有的操作系统到 AIX 5.2 ,可以在同一台服务器上,同时保留 AIX 5.1 和 AIX 5.2 两套系统。
在 AIX 5.1 和 AIX 5.2 系统中引入逻辑分区和动态逻辑分区的功能,对应用而言并不具有破坏性,应用程序在逻辑分区中的运行,并不要求必须改变。尽管多数应用并不受动态逻辑分区操作的影响,但某些绑定特定系统资源的应用需要做些改变以适应动态逻辑分区操作

2.DLpar对于磁带机和光驱的操作

利用 NFS 实现共享
将光区分配给 LPAR A, 在其上创建一 cdrom 文件系统 , 利用 NFS 的 export 将此 cdrom 文件系统 设为共享网络文件系统 . 在 LPAR B 上 使用 NFS mount , 这样 LPAR B 就可以访问光驱了

AIX 在服务器端
1 ,启动 portmap 和 nfs 守护进程
---startsrc -s portmap -
--startsrc -g nfs
2 , mount /cdrom
3 ,将 /cdrom 加入 Export List 中 -
--smitty mknfsexp ---Enter the PATHNAME of the directory to export (for example, /cdrom).
---Change the MODE of export directory to read-only.
---Enter the HOSTS & NETGROUPS allowed client access.
---Enter HOSTS allowed root access.
--- 回车执行
4 , showmount -e 观测在客户端
1 ,启动 portmap 和 nfs 守护进程
---startsrc -s portmap ---startsrc -g nfs
2 , mkdir /cdrom
3 , Enter smitty mknfsmnt. Enter the PATHNAME of the mount point (for example, /cdrom).
Enter the PATHNAME of the remote directory (for example, /cdrom). Enter the HOST where the remote directory resides. Change the MODE for this NFS file system to read-only.
回车执行

3. Dlpar配置小结

LPAR 和 DLPAR 介绍

LPAR 既逻辑分区,指的是将一个物理的服务器划分成若干个虚拟的或逻辑的服务器,每个虚拟的或逻辑的服务器运行自己独立的操作系统,有自己独享的处理器、内存和 I/O 资源。动态逻辑分区 (DLPAR) 允许在不中断应用操作的情况下,增加或减少分区占用的资源。 IBM 将这些灵活的技术从大型机( mainframe )平台带到了基于 POWER 4 处理器的 IBM pSeries 平台上从而极大的降低了该技术的价格和成本,到了 POWER 5 处理器,该项技术得到进一步发展,并引入了微分区技术。
动态逻辑分区的资源调整功能让系统管理员可以自由添加、删除或在分区之间移动系统资源,例如 CPU 、内存、 I/O 适配器的分配,而不需要像原来修改之后重新启动分区。这样,微分区技术的引入,更使得动态逻辑分区的资源调整功能不但可以移动物理资源,还可移动、增减虚拟资源,具有广阔的应用场景。这样系统管理员就可以根据分区系统负荷和分区业务运行特点,随时将资源动态分配到需要的地方,从而大大提供资源的利用效率和灵活性。
对于服务器是否可以使用动态 LPAR ,是要看安装在服务器上的软件是否支持。
如果希望实现动态 LPAR 需要在相关的分区安装 AIX 5L 5.2 及以上版本,并且 HMC recovery 软件必须至少是 3.1 版本 ( 或更高 ) 。
如果分区运行的是 AIX 5L 5.1 以下版本,动态逻辑分区不可用。每个 LPAR 至少需要一些资源,下面是每个 LPAR 的最小需求:
Power 4 系列小型机
• 每个分区至少有一个处理器。
• 每个分区至少有 256 MB 内存。
• 每个分区至少有一块硬盘用于安装和存储操作系统 ( 对于 AIX, 做为 rootvg)
• 每个分区至少有一块硬盘适配器或集成的适配器(含 VIO server 上的虚拟适配器)用于连接硬盘。
• 每个分区至少有一块网卡(含虚拟网卡)用于每个分区与 HMC 的连接。
• 每个分区必须有一个安装模式,例如 NIM 。
Power 5 系列小型机
• 每个分区至少有一个处理器。
• 每个分区至少有 128MB 内存。
• 每个分区至少有一块硬盘用于安装和存储操作系统 , 或 VIO server 上提供的 1 块虚拟盘(对于 AIX, 做为 rootvg )
• 每个分区至少有一块硬盘适配器或集成的适配器(含 VIO server 上的虚拟适配器)用于连接硬盘。
• 每个分区至少有一块网卡(含虚拟网卡)用于每个分区与 HMC 的连接。
• 每个分区必须有一个安装模式,例如 NIM 。
Power 4 系列小型机和 Power 5 系列小型机在分区动态资源调整上主要有以下不同,
• HMC 配置方式不同, Power 4 系列小型机所配 HMC 为 4 版本以下, Power 5 系列小型机配备的 HMC 则为 4 版本以上,不再允许修改 /etc/hosts (除非使用 hscpe 帐号)。
• Power 5 系列小型机引入了微分区技术 , 微分区同样可以参与资源动态分配。

设备信息 :

IBM P560Q 小型机 一台 ,
IBM D20 扩展 drawer 一台 ,
HMC 一台
7212-103 1U 式机架式磁带机 一台 .
配置信息

8 CPUs , 16G MEM , 8 DISKS , 4 ISCSI CARDS , 4 1979 网卡 , 1 PCI-X scsi 控制器 ( 连接 7212-103 磁带机用 ) .

分区 lpar 信息
说明 : 此次安装的 P560Q 的设备暂时作为 ** 的测试环境 . lpar 划分应客户需求为平均分配 , 均为 2C4G, 1 iscsi 卡 ,1 1979 网卡 .

LPAR1 : 系统版本 : AIX 5.3
IP 地址 14.1.79.1
LPAR2 : 系统版本 : AIX 5.3
IP 地址 14.1.79.2
LPAR3 : 系统版本 : AIX 5.2
IP 地址 14.1.79.3
LPAR4 : 系统版本 : AIX 5.2
IP 地址 14.1.79.4
HMC : IP 地址 14.1.79.5 ( 划分动态 LPAR 需要 )

Dlpar 配置

  1. 在各分区编辑 /etc/hosts 信息 , 使得其他分区包括 HMC 的相关信息都在该分区的 /etc/hosts 中 , 以达到信任机制和解析的作用 .
    如 : /etc/hosts :
    Lpar1 14.1.79.1
    Lpar2 14.1.79.2
    Lpar3 14.1.79.3
    Lpar4 14.1.79.4
    P560Q 14.1.79.5
    ( 说明 : p560Q 代表的是 HMC 的名称 , 以实际环境定义为准 )
  2. 在各个分区及 HMC 的 Test network connectivity , ping 其他分区以及 HMC 的 IP 和 hostname , 看是否能 ping 通 , 如不通 , 请检查网线连接和 /etc/hosts 信息是否完整 .
  3. 安装 rsct 、 csm.client 等软件包,这些都是动态 LPAR 的工具包 , 这些软件包必须要安装在逻辑分区上,否则 DLPAR 无法正常工作。
    软件包类名 软件包名
    SRC bos.rte.SRC
    RSCT 基本包 rsct.basic.*
    RSCT 核心 rsct.core.*
    CSM 核心 csm.core
    CSM 核心 csm.client
    ServiceRM ServiceRM devices.chrp.base.ServiceRM
    DRM DRM devices.chrp.base.rte

    可以通过 lslpp -l rsct.basic*
    来查询需要的包是否已经安装 .
    如未安装 , 通过 smitty installp 安装所缺少的包 .

  1. 检查相关服务进程 :
    lssrc -a |grep IBM
    查看是否有 IBM.DRM 这个进程。如果连好网线,应该有 6 个 IBM 的进程,而且都是 active 的 . 如有未启动的项 , 检查相关的包的安装 .

Dlpar 移动资源
以光驱划分为例 :

  1. 查找光驱 cd0 的父设备并在该分区删除

lsdev -Cl cd0 -F parent -> scsi1

lsdev -Cl scsi1 -F parent -> sisscsia

lsdev -Cl sisscsia -F parent -> pci10

rmdev -l pci10 -d -R -> ok

  1. 查找光驱所在的 slot

    lsslot –c slot . 定义为 C5 位置的 slot.

  2. 然后用户可以在 hmc 上运行 dlpar 功能把 cd0 从老的 lpar 迁移到新的 lpar 上。
    在新的 lpar 中运行

    cfgmgr 就应该可以看到 cd0 了

    小结
    本次 DLPAR 环境 4 个 lpar 分区中 , 有 2 个为 AIX 5.2 的系统 , 而设备配置中的 7212-103 1U 式机架式磁带机 所连接主机的 SCSI 控制器为 PCI-X 结构 , 不支持 AIX 5.2 的系统 .(AIX 5.3 的可以 ).
    当动态把磁带机从 AIX 5.3 环境划分到 AIX 5.2 环境中 , 该 SCSI 的 slot 设备信息将显示为 Unknow , 在该系统下 cfgmgr 也无法认到磁带设备 .

4.DLPAR的配置方法和RMC(Resource Monitoring and Control)授权和验证方式. 说明 :
一 . 配置 DLPAR 的要求
建议将 HMC (Hardware Management Console) 的版本升级到 Release 3, Level 2.4 或以上,可以运
行 hsc version 命令来确认版本。 LPAR 中操作系统的版本需要 AIX 5.2 或以上版本,并且安装如下软
件包:
rsct.core*
csm.client
二 . 设置与 DLPAR 相关的守护进程

  1. 检查 HMC 上守护进程运行的情况

    su - root

    lssrc -a

    Subsystem Group PID Status
    ctrmc rsct 822 active
    IBM.DMSRM rsct_rm 906 active
    IBM.LparCmdRM rsct_rm 901 active
    如果以上的守护进程都是 active 的,则跳到步骤 2 ,如果以上任何守护进程处于 inoperative 状态,采
    用以下命令手工启动它, startsrc -s < 进程名 > ,如 : startsrc -s ctrmc 。如果进程仍然无法启动
    请与 IBM 联系。

  2. 在每一个需要支持 DLPAR 的分区中检查 AIX 的守护进程运行的情况。

    su - root
    lssrc -a | grep rsct
    Subsystem Group PID Status
    ctrmc rsct 21044 active
    IBM.CSMAgentRM rsct_rm 21045 active
    IBM.ServiceRM rsct_rm 11836 active
    IBM.DRM rsct_rm 20011 active
    IBM.HostRM rsct_rm 20012 active
    IBM.DRM 和 IBM.HostRM 属于 "lazy started" 进程,它们只在被使用时才处于 active 状态,如果 IBM.DRM 和 IBM.HostRM 处于 inoperative 状态,很可能是网络或主机名设置问题,请参阅 三,如果以上进程处于 inoperative 状态,用以下命令手工启动它, startsrc -s < 进程名 > ,如 :
    startsrc -s IBM.CSMAgentRM 。
    在 AIX 5.2 ML2 以后的版本中, ctcas 也属于 "lazy started" 进程,如果处于 inoperative 状态,不
    需要手工启动。
    三 . 设置 RMC/DLPAR 网络和主机名
    通常 DLPAR 的问题都与不正确的设置网络和主机名有关。 DLPAR 要求在 HMC 和每个 LPAR 上主机名与 IP 地
    址的对应关系必须完全相同。
  3. 首先,确认 HMC 和每个 LPAR 中 IP 地址和主机名的设置。在 HMC 和每个 LPAR 中运行 hostname 命令,
    得到 HMC 和每个 LPAR 的主机名。
  4. 然后在 HMC 和每个 LPAR 中运行 host 命令检查 HMC 和每个 LPAR 中主机名与
    IP 地址的对应关系是否一致。
    如:
    在 HMC 上

    hostname
    HMC.company.com
    host HMC.company.com
    HMC.company.com has address 9.3.14.199
    host LPAR1.company.com
    LPAR1.company.com has address 9.3.14.200
    host LPAR2.company.com
    LPAR2.company.com has address 9.3.14.201
    在 LPAR1 上
    hostname
    LPAR1.company.com
    host HMC.company.com
    HMC.company.com has address 9.3.14.199
    host LPAR1.company.com
    LPAR1.company.com has address 9.3.14.200
    host LPAR2.company.com
    LPAR2.company.com has address 9.3.14.201
    推荐采用 /etc/hosts 文件而不是用 DNS 服务器做地址解析,并且在每个分区中 ( 注意不是在 HMC 上 ) 都存
    在 /etc/netsvc.conf 文件,文件中只包括一行: hosts=local, bind
    从新启动 RMC
    /usr/sbin/rsct/bin/rmcctrl -z
    /usr/sbin/rsct/bin/rmcctrl -A
    四 . 可以用如下方法检查设置是否正确。
  5. 在 HMC 上列出分区

    /opt/csm/bin/lsnodes -a Status
    partition01 1
    partition02 0
    partition03 1
    以上 1 表明分区是启动的并且被验证为支持 DLPAR , 0 表示其他。
    如果分区已经启动但仍显示 0 ,则需要检查网络和主机名的设置,如果 HMC 刚刚从新启动则需要等待几
    分钟使信息同步。
  6. lspartition -dlpar
    <#0> Partition:<001, partition01.company.com, 9.3.206.300> Active:<1>, OS:,
    DCaps:<0xf>, CmdCaps:<0x1, 0x0>
    <#1> Partition:<002, partition02.company.com, 9.3.206.300> Active:<0>, OS:,
    DCaps:<0xf>, CmdCaps:<0x1, 0x0>
    <#2> Partition:<003, partition03.company.com, 9.3.206.300> Active:<0>, OS:<, 5.1F>,
    DCaps:<;0x0>, CmdCaps:<0x0, 0x0>
    如果所有 AIX 5.2 的分区都显示 Active<1>, ..., DCaps:<0xf> ,说明 DLPAR 的设置是正确的,在上面
    的例子中, LPAR 002 没有启动,而 LPAR 003 是 AIX 5.1 的操作系统。
  7. 确保 /var 文件系统没有 100% 的占用
    用 df 命令检查 /var 文件系统,如果 100% 的被占用,请删除不需要的文件,或扩大 /var 文件系统,然后
    用以下命令修复被破坏的文件:

    rmrsrc -s "Hostname!='t' " IBM.ManagementServer
    /usr/sbin/rsct/bin/rmcctrl -z
    rm /var/ct/cfg/ct_has.thl
    rm /var/ct/cfg/ctrmc.acls
    /usr/sbin/rsct/bin/rmcctrl -A

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

17

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关问题

相关资料

X社区推广