gracejh
作者gracejh·2021-01-20 18:06
系统架构师·浪潮商用机器有限公司

XX路局k1 Power资源池/物理分区混合案例介绍

字数 3635阅读 3452评论 0赞 0

浪潮商用机器售前技术支持,白洪涛

项目背景:

铁路运输是国民经济发展的重要支柱,伴随着我国综合国力提高,全国铁路年均客货周转量逐年攀升,营运里程数快速增长,全国铁路固定资产投资力度也在逐年增大,在总的投资构成中,信息化建设的投资占了非常重要的一部分。

随着投资力度加大,铁路运输的市场经营、运输生产、社会服务、运行维护和管理决策等方面的信息化、现代化建设被提升到一个新的高度。如何通过信息化建设加快实现铁路运输生产调度指挥现代化,推进铁路客、货营销现代化,提高铁路运输企业经营管理现代成了提升铁路运输生产率和竞争力的关键问题。

在此背景下,传统的竖井式信息系统基础架构已经无法满足业务发展需求,主要体现在:

  1. 传统架构下,设备的总体硬件利用率低下,业务压力分配不均匀,大部分设备硬件利用率低下,少量设备硬件利用率接近饱和,存在明显的 “热点”。
  2. 市场变化空前高速,新应用上线速度及频率大大提高,及时反应,快速上线成了基本要求,传统架构难以满足。
  3. 春运、五一十一假期,使得应用系统的压力变化大,业务系统性能弹性要求越来越高,基础设施的灵活调整能力成为重要考量标准。
  4. 铁路运输服务水平逐年提升,客户满意度成为考量竞争力的重要指标,业务系统的连续性及稳定性被提到了一个新的高度。
  5. 软件定义基础设施已经成为主流,应更多将精力从基础架构上转移到业务应用上,信息系统基础设施做为业务应用的支撑环境,需满足业务应用的多种需求,基础设施运维需进行简化。
  6. 随着业务压力的不断增加,机房空间、能耗、空调散热系统压力都将面临挑战,传统架构下没有有效的应对措施。

现状及痛点分析

XX 路局信息中心机房于 2000 年进行改造建立,系统中采用 2 台 2012 年购买的小型机,运行 SIMS 、调度等业务,采用 12 台 2014 年购买的 X86 服务器运行车辆管理、车辆、电子商务外网、路局十八点、电子商务内网、外部门户、内部门户、路局应用等业务,现有业务均采用物理机 + 高可用软件的双机模式进行部署。经调研发现系统中,调度、车辆管理服务器的业务压力较大,硬件利用率包括处理器、内存在业务峰值期间,使用率均达到 70% ,而其他业务系统硬件利用率很低,绝大部分资源处于闲置状态,计算资源分配严重不均。当前机房内共有服务器、存储等设备近一百台,机房承载能力处于接近极限,空闲空间严重不足,电力供应达到上限,空调散热能力也开始不足。

此外,随着路局信息系统规模不断发展,功能逐渐完善,新增业务的数量也在逐年增加,在现有架构下,每新增一套应用,就涉及到新设备的采购,需执行预算申请、项目申报、项目立项、招标投标等一系列复杂的内部流程,新应用的基础环境准备慢,上线周期长,来自业务部门的压力非常大。

更重要的是,随着使用年限逐渐增加,现有设备早已超出官方维保年限,且已经停产,故障率逐渐升高,一旦关键部件损坏导致服务器宕机,业务连续性就会受到影响,运维部门疲于解决频发的硬件故障,压力很大,一旦临近客货高峰期,运维人员几乎全体枕戈待旦,精神高度紧张。虽然客户购买了第三方维保,且有驻场的第三方运维人员,可以确保备件供应及故障解决,但备件时效及备件品质无法得到保障,且费用高昂。

解决方案概述

通过对客户现有设备及业务系统进行梳理,我们制定了针对性的解决方案,该方案主要是对客户现有的基础设施架构进行改造,依托浪潮商用机器 K1 Power 小型机产品的 LPAR 逻辑分区及 PowerVM 虚拟化分区技术,实现对现有业务的高度整合与计算资源灵活调度,帮助客户从传统的竖井式架构转变成新型资源池 / 物理分区混合架构,打造基于 Power 的计算资源池。

本项目中,共配置两台 K1 Power E950 ,每台 E950 配置 44 核 3.2-3.8GHz POWER9 处理器, 2TB DDR4 内存,通过 LPAR 逻辑分区技术部署重点业务,包括 SMIS 、车辆管理、车辆、调度、电子商务外网,每个分区拥有独占的硬件资源;通过 PowerVM 虚拟化分区技术部署外围业务,包括路局十八点、电子商务内网、外部门户、内部门户、路局应用,分区之间硬件资源可以共享。通过这种方式,将原有 18 台服务器全部业务整合到这两台 K1 Power E950 中,并在两台 K1 Power E950 的业务分区之间,凭借 PowerHA 或者应用软件自带集群功能实现高可用。

方案亮点

信息系统从传统的竖井式架构向资源池方向转变对于客户来说,既是必要的也是正确的,但这种转变需经过审慎的考量,通过何种手段实现,选择什么样的产品,采用什么技术,往往决定着转变的成功与否。而 K1 Power 服务器凭借其独特的 LPAR 逻辑分区技术 +PowerVM 虚拟化技术,可以帮助客户轻松实现架构转变。

其中, LPAR 逻辑分区技术可在 Hypervisor 层将一台服务器逻辑切分成多台,独立运行互不干扰,并可通过 DLPAR 技术在分区间在线调整资源,兼顾隔离性和灵活性需求。 LPAR 逻辑分区的资源分配粒度非常精细,低至一个 CPU 核心、 256MB (最小 1GB )、一块 PCI 卡,在应对业务压力波动时,可以做到非常精细的资源管理与调度。对于客户高安全性、高隔离性、高灵活性的关键业务分区来说, LPAR 逻辑分区是理想的承载平台,可以轻松实现关键业务分区的整合与资源池化。

PowerVM 虚拟化技术则是基于 Power 固件层 +VIOS 虚拟 IO 服务器实现的微分区技术,不同于其他厂商的虚拟化技术, PowerVM 的处理器虚拟化及内存虚拟化不依赖于虚拟化操作系统层,而是在固件层面实现的,这就使得 PowerVM 拥有更强的性能(接近物理机),更高的灵活性(动态调整资源),更好的安全性(无安全漏洞)。 PowerVM 支持创建共享处理器资源池,并自由向池中添加或删除分区,同时可指定一系列资源分配策略,可以自动或者手动在任意分区之间调整硬件资源。 PowerVM 的资源划分粒度比 LPAR 更加精细,可做到最低 1/20 CPU 核心创建一个分区,单机最多可创建高达 1000 个分区。 PowerVM 可以为用户提供一个动态的,共享的基础架构,整合大量外围业务,减少硬件,软件,管理和能源成本。此外 PowerVM 还支持 LPM 和 Remote Restart , LPM 可允许虚拟化分区将在线 / 离线分区动态迁移至目标服务器,整合优化服务器资源,使服务器负载均衡,在计划内停机等维护等场景下 , 对外业务服务零中断; Remote Restart 可实现服务器内分区在远程目标服务器自动 / 手动重启,当服务器遭遇计划外 ( 如异常断电等 ) 停机时在最短时间内恢复业务 , 消除 / 减少意外停机造成的损失。搭配 PowerVC ,可以很快的为客户创建基于 Power 的 IaaS 私有云,实现底层基础设施的统一管理、快速部署、灵活调度。

此外 LPAR 和 PowerVM 可以在同一台机器上完美共存,最大化满足客户各种使用场景需求。

客户收益

通过本次项目,帮助客户完成了从传统架构向新架构的初步转变,实现了基础架构硬件资源的资源池建立,为未来客户信息系统建设提供了思路和模板,并为将来客户建立私有云做好了技术准备,使客户获得以下诸多收益:

  1. 高整合比

通过对现有业务压力计算,仅用两台 K1 Power E950 就可以整合原有 18 台服务器,达到 1:9 的整合比,较大幅度降低机房空间占用,降低能耗,降低散热压力,降低运维压力,无形之中帮助客户大大降低总体成本。

  1. 强大性能

K1 Power E950 采用最先进的 POWER9 处理器,拥有 3.2-3.8GHz 的高主频,单核 8 个线程,单核 10MB 三级缓存,单处理器 128MB 四级缓存,以及 230GBps 的内存带宽,并支持 PCIE 4.0 。整合 18 台服务器之后, K1 Power E950 服务器的整体硬件利用率在业务高峰期,处理器及内存的使用率仍可保持在不高于 35% 的水平,为客户未来 5 年的业务发展提供了足够的计算资源余量。

  1. 主机级 RAS

Power 服务器拥有完整的 RAS 设计堆栈,从底层硬件的选件,微码,虚拟化,操作系统到上层的高可用软件,其正常运行时间达到 99.9996% ,可大幅提升客户的业务连续性。

  1. 弹性灵活

Power 服务器可将 CPU 、内存和存储等系统资源整合至共享池,以实现多个工作负载之间的动态重新分配,并可在服务器之间实时转移正在运行的工作负载,以支持平台升级、系统平衡或避免计划内维护停机。

  1. 敏捷交付

通过 PowerVC 可实现高级虚拟化管理、虚拟机捕获与快速部署、虚拟机在线迁移、基于策略的工作负载部署、工作负载优化及快速配置等虚拟化全生命周期管理,可大幅提升新应用上线部署速度。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广