北京荣歆咨询
作者北京荣歆咨询·2016-11-16 15:23
系统架构师·北京荣歆咨询有限公司

基于某企业ERP系统移机方案 讨论存储规划的重要性

字数 3588阅读 4905评论 0赞 1

在IT系统的建设过程中,规划、实施、运维、升级各个过程中会遇到各种各样的问题。这些问题有些比较容易解决,有些却难以解决,有些虽然暂时解决了,却给将来的运维和升级带来潜在的风险。运维中爆发出的某个问题也许是实施过程中埋下的隐患。升级时的种种不便也许是规划时未能充分考虑到系统增长扩容的程度和速度等需求。毕竟,系统没有上线以前我们还是有很多选择的,此时充分了解将来系统的局限性,以及如何降低风险是非常必要的。引用一句英文谚语“Fail to plan is planning tofailure.” 如何规划出更好的、更适合的IT基础架构,是IT系统建设过程中非常重要的部分。

让我们先来看一下某企业在IT建设发展过程中的一个真实需求,相信大多数用户在IT建设中都会有类似的经历。

客户背景及现状描述

一、机房主要设备:
UPS电源机柜、ERP集群(共四台P系列小机(两台P740、两台P720))、F5负载均衡、TSM服务器一台(WinServer2003R2)、TS3310带库一台、V7000磁盘阵列一台、两台Cisco4948交换机、两台2498-B24光交。
二、设备连接情况:
四台小机AIX系统:

  • AP01(P740)装有WAS5.1部署公司ERP系统
  • DB01(P740)装有DB2数据库,TSM代理程序
  • DI01(P720):数据交换中心DIServer。(下面各二级服务器上安装有DIClient,双方通过发行订阅关系进行数据传输)
  • TS01(P720)测试机。部署WAS、DB2、ERP系统,正式机程序上线前通过该测试机测试。(图中未标识)

四台小机通过光交与V7000存储相连,另外:四台小机还用过4948交换机与V7000相连。V7000三个raid5组成一个stgpool,通过划分卷映射至小机AIX系统。

用户需求及实现目标:

.目前存储阵列V7000就一台,如果要搬迁机房,在花费成本最低的情况下,如何才能保证业务不中断(或控制在1小时左右)且数据是安全完整的?若需要购买另一台V7000的话,如何才能使两台存储数据实时同步?

解决方案的原则 及考虑方面

对于需求的理解:

大致分两部分:

一> 在注重业务连续性的要求下进行IT系统的搬迁;

二> 对IT系统的备份机制、网络应用服务器及相关监控和分析等方面进行优化。

企业在IT系统的建设和升级过程中都会遇到各种各样类似的需求。

企业的IT系统建设是非常复杂和不断变化的。业务需求和业务量不断的增长促使IT系统的功能和容量呈线性或指数型增长。而IT基础架构由于其本身的建设规律等技术条件制约,一般呈阶梯式增长。业务需要和运维的技术条件之间的矛盾长期存在。

下面先简要讨论一下业务连续性方面的问题,也就是需求中目前主要关心的问题:

业务连续性可以从两个维度来讨论,

一个维度是规划与实施,

1)所谓规划就是为了达到一定的业务连续性,需要预先规划,采用什么样的技术和条件准备。比如为了达到多站点双活和亚分钟级的业务切换,也许需要DS8000 MM+AIX HyperSwap这样的顶级灾备方案。而DS8000 MM+PowerHA XD一般可以满足十分钟级别的切换需要。如果采用异步数据复制技术,一般时间更长,即使是DS8000一般也至少需要半小时的切换时间,因为异步会导致数据可能不是最新,需要人工等其他机制来决定是否启用异步灾备的数据。

2)实施也非常重要,因为必须有一个完整并成功的实施过程,才能达到规划的效果。换句话说,越是高大上的灾备功能,实施本身越是复杂的,而在成功实施前,当然无法使用这样的功能。所以,对于本次企业的实际需求来说,很多保障业务连续性的方案是远水解不了近渴的。切实的方案首先是能在线实施的。如果需要生产系统中断来实施的话,也许应用中断的时间反而会长于直接搬迁的时间。

另一个维度是风险控制与功能实现。

在任何IT规划与实施过程中,当然要实现尽量多、尽量好的功能。但同时,为实现这些功能,我们要付出多少人力物力财力,以及会遇到哪些风险,都是必须要充分分析和权衡的。对于生产系统,特别是生产数据,一切操作必须慎重再慎重。规划的任何不周全,或者实施的疏忽都可能导致灾难。

系统迁移方案系统迁移方案(共两个可选方案,在成本和停机时间上有所不同)

可选方案一:

特点:成本低。无需增加任何服务器及存储整机设备。停机时间窗口可控。

步骤:

停机窗口前准备工作

  1. 做好所有端口、线缆标签及连线图等准备工作
  2. 备份操作系统,可采用aix clone的方式。(如无闲置硬盘,需购买)
  3. 检查所有硬件无报错。
  4. 通过PowerHA将DB01应用切换到AP01上,并确认应用正常。(应用会中断2-3分钟)
  5. 通过PowerHA将DI01应用切换到AP01上,并确认应用正常。(应用会中断2-3分钟)
  6. 通过PowerHA将DB01和DI01应用分别切回,并确认应用正常。(应用会中断2-3分钟)
  1. 迁移TS01测试机到新机房备用。
  2. 通过PowerHA将AP01应用切换到DB01上。(应用会中断2-3分钟)
  3. 确认应用正常。
  4. AP01关机,断该机LAN网和SAN网后重启,确定无故障后再次关机。
  5. 将AP01迁移到新机房并准备好与SAN和LAN的线缆待用。(避免网络冲突!)
  6. 备份数据,主要是数据库。

停机窗口内工作步骤:(预计约1小时,受实际环境影响)

  1. 停止DB01和DI01。确认DB01关闭后,关闭V7000。
  2. 迁移V7000,2个SAN交换机和2个网络交换机,以及F5。连备好的线缆。
  3. 启动设备,注意顺序。
  4. 通过PowerHA将DB01和DI01的应用都在AP01上启动。
  5. 确认应用正常。

停机窗口后工作

  1. 搬迁DB01和DI01前,关机重启并确认无故障。
  2. 搬迁DB01、DI01、DS3310、TSM server。
  3. 按照原端口连好所有线缆(注意不要干扰AP01相关的LAN和SAN连线)
  4. 通过PowerHA切回DB01和DI01的应用,恢复正常状态。
  5. 确认应用正常无故障。

完成迁移工作

可选方案二

特点:成本高。需增加服务器及存储整机设备。需SAN和LAN光缆在两机房间互联。无需申请停机时间。

  1. 确认在两机房间SAN和LAN光缆稳定可用。
  2. 增加一台V7000,容量同原机相同。
  3. 在新机房增加LAN和SAN交换机(F5如新购,需考虑切换问题)
  4. 配置新V7000的链路并映射给4台小机。确认无报错。
  5. 通过AIX mirror将数据在线同步复制到新V7000
  6. 参照方案一中的准备步骤将AP01迁移到新机房。
  7. 在新机房启动AP01,确认无故障。(LAN和SAN所以链路都畅通)
  8. 通过PowerHA切换DB01应用到AP01上,并确认。
  9. 参照方案一迁移DB01到新机房。
  10. 通过PowerHA切回DB01应用,并确认。
  11. 同样操作DI01。
  12. 通过aix LVM管理功能拆开原V7000 mirror。(如果期望保留这个灾备架构,也可保留)
  13. 确认后关闭原V7000,迁移到新机房并重新加入mirror。
  14. 迁移DS3310及TSM server

完成迁移。

迁移注意事项:

  • 搬迁前的准备工作一定要细致,对各个设备的布局和线缆的位置要了解清楚,并做详细的标注,包括出具结构拓扑图,位置示意图,设备和线缆的标记,系统重要数据的备份等等。
  • 搬迁前,待所有机器关闭之后,重新加电启动机器,如果机器能够启动,说明系统完好;如果加电之后就有问题,说明系统在搬迁之前就有问题,不是在搬迁过程中造成的。
  • 如遇设备硬件问题,应及时维修。
  • 数据库和应用系统起不来时,拿出搬迁前的全备份及时恢复。
  • 搬迁时,尽量避免剧烈的碰撞,要做到轻拿轻放,在装车时,各个设备和设备与车厢之间要放置泡沫塑料或纸板来减轻运输途中的碰撞。
  • 准备纸箱子,铺在运输车的底上,一是增加摩擦,二是防止把机器刮坏了。如果有的机器过重,需要用叉车才能装到运输车上,不建议用插车直接叉在设备上,就需要找一个底座,准备一个大的木箱子底座,一般在设备到货的时候拆下来的那个就非常好用。
  • 搬迁前和搬迁后都要根据设备清单对设备进行清点,避免遗漏。
  • 整个搬迁过程中,和各个应用系统和设备负责人、服务商做好沟通协调工作。
  • 搬迁过程前期要与设备质保方商谈设备搬迁过程的质保情况。
  • 搬迁前要确认UPS安装环境,希望建设单位能够提供支持,主要是确认电源供电情况。
  • 搬迁前通知网络支持部门提供线路切割。
  • 对搬迁过程实时记录,做好文档整理工作。

总结:

一个成功的IT系统在建设过程中必然会遇到用户不断增长、数据量不断增加、业务模块不断扩充等各种各样的需求。这些需求对IT基础架构来说,都是升级的需求。如何在规划时更深入地了解未来业务需求,充分了解现有IT技术的各种局限性,同时对IT基础架构的发展趋势有前瞻性了解,是我们这些IT基础架构技术人员努力的方向和价值所在。只有这些方面做的更好,我们才能有更适合用户的、更平衡的、满足未来发展需求的IT系统。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广