真实环境下机房如何不停业务搬迁?(走进企业)

环境描述:
一、机房主要设备:
UPS电源机柜、ERP集群(共四台P系列小机(两台P740、两台P720))、F5负载均衡、TSM服务器一台(WinServer2003R2)、TS3310带库一台、V7000磁盘阵列一台、两台Cisco4948交换机、两台2498-B24光交。

二、设备连接情况:
四台小机AIX系统:AP01(P740)装有WAS5.1部署公司ERP系统
                       DB01(P740)装有DB2数据库,TSM代理程序
                       DI01(P720):数据交换中心DIServer。(下面各二级服务器上安装有DIClient,双方通过发行订阅关系进行数据传输)
                       TS01(P720)测试机。部署WAS、DB2、ERP系统,正式机程序上线前通过该测试机测试。(图中未标识)

1111111111111.jpg


四台小机通过光交与V7000存储相连,另外:四台小机还用过4948交换机与V7000相连。


V7000三个raid5组成一个stgpool,通过划分卷映射至小机AIX系统。

22222222222222222222.gif


平时业务:通过网线传输数据。Lan-Free备份时通过光纤传输数据。(这是个人理解,不知道对不对)

TSM服务器上装有tsm server1软件服务和AC服务。通过web界面可查看带库备份情况。

TS3310包括33盘数据带,2个清洗带,2个驱动器。

三、问题求助:

1.首先TSM Server在WinServer2003 R2系统上,在DB01(AIX6.1)上装有客户端程序和TSM Agent代理程序,AP01和DI01上都装有tsm客户端程序,正常备份时需要有dsm sche调度进程开启。

请问:能否结合这个实际情况将Lan-Free讲的具体点,我一直不太明白这块。在AIX上是如何安装配置tsm客户端的?两台小机AP01和DI01是如何通过DB01代理实现的备份调度?什么机制引起的?(请说的详细些,便于我们会员能够按您给的建议自己动手操作一遍,加强学习交流)

2.目前存储阵列V7000就一台,如果真要搬迁机房,在花费成本最低的情况下,如何才能保证业务不中断且数据是安全完整的?

若需要购买另一台V7000的话,如何才能使两台存储数据实时同步?另一台是全新的,如何具体操作呢?能否有详细步骤?

3.WAS在AIX上的具体安装部署配置步骤还不太明白?另外我们这个WAS版本5.1太低,能否给出个不停业务的情况下升级版本的具体方案?(可以利用HACMP)

4.另外在F5中通过脚本策略通过不同的WAS虚拟机访问不同的ERP模块画面,在WAS控制台共设置了6个应用服务器(JVM虚拟机),但虚拟机经常有宕机的情况,现场打印报表或者其他不明操作会导致虚拟机内存溢出,生成好多javacore或者heapdump文件,针对这点有没有好的监控WAS的软件?我们的WAS版本5.1,好多监控软件不支持,因为不熟悉所以跑着业务也不敢动手升级版本,如果出问题损失可就大了。

5.javacore和heapdump文件的分析有没有经验可以学习?IBM提供的分析工具你知道对我们这些不太懂代码的人来说查找问题根源比较费劲。

问题都是实际工作中遇到的,有高手大侠的话可以给大家一起解答下,共同学习进步。在此代表求知若渴的广大会员们谢谢你们了!

———————————————————————————————————————————————————

结合以上企业的问题,AIX专家俱乐部会举办一个:走进企业,共同解决企业实际IT难题活动。由于该问题比较多,需要时间来进行澄清需求,所以社区会员均可以回帖询问发帖者,你认为需求描述不清楚的地方或者你还需要了解的地方都可以询问,发帖者有义务需要每天进行回帖澄清会员的问题。

本次活动礼品由:AIX专家俱乐部提供。该企业实际问题由:某钢铁公司企业实际难题

活动目的:走进企业,让更多社区会员共同解决企业的实际IT难题;

澄清需求时间:1月16日—1月23日

提交解决方案或者解决思路时间:1月28日   (所有会员均可以参与,可以针对发帖者的一个或者多个问题进行撰写解决方案或者解决思路,字数不限。发帖者会从大家提交的思路或者方案中,评选一个最佳满意的方案。该方案即可成为本次活动的优胜方案。获奖者可以获得社区提供的精美礼品一份。

解决方案提交:参与社区ID号并附上解决方案作品邮件提交到:peibin.peng@twtgroup.com.cn

获奖公布时间:1月30日


本次获奖礼品图:



本期最佳实操解决方案奖获得者:“北京荣歆咨询”

参与62

51同行回答

798683133yj798683133yj  系统架构师 , 政务云某公司
1、首先,新机房电力、新的网络设备、存储交换机、新存储都到位并调试好。2、小型机两对里的备机可以先迁过去。3、然后通过旧机房的主机系统把业务切到备机上。4、新存储同步旧存储数据。(顺便问下旧存储数据量到底有多大,直接影响迁移时间)。5、得跟业务部门商量好调试时间,...显示全部
1、首先,新机房电力、新的网络设备、存储交换机、新存储都到位并调试好。
2、小型机两对里的备机可以先迁过去。
3、然后通过旧机房的主机系统把业务切到备机上。
4、新存储同步旧存储数据。(顺便问下旧存储数据量到底有多大,直接影响迁移时间)。
5、得跟业务部门商量好调试时间,能争取时间当然是长些好。
6、准备好主机、存储、交换机、业务等各类工程师在场,随时调试和应急。
这是本鸟一个粗糙的思路,希望大侠们指导指导!收起
金融其它 · 2015-01-20
浏览1244
798683133yj798683133yj  系统架构师 , 政务云某公司
楼上的各位大侠方案都挺好!本鸟觉得要求的时间越短,成本可能很高。新机房的电力环境和tcpip网络、存储网络得事先准备和测试好。停机时间窗口得确认好,真实施起来挺费时、费力、费钱的。...显示全部
楼上的各位大侠方案都挺好!
本鸟觉得要求的时间越短,成本可能很高。新机房的电力环境和tcpip网络、存储网络得事先准备和测试好。停机时间窗口得确认好,真实施起来挺费时、费力、费钱的。收起
金融其它 · 2015-01-20
浏览1203
北京荣歆咨询北京荣歆咨询  系统架构师 , 北京荣歆咨询有限公司
回复 24# hufeng719 关于这个SAN光纤线的问题,我主要是问有没有条件在新旧机房间拉光纤线(就是光交用的线)?线长能控制在250米以内吗?毕竟在厂区拉线可能会有限制,不是想拉就拉的,而距离一般也不能走直线距离。...显示全部
回复 24# hufeng719

关于这个SAN光纤线的问题,我主要是问有没有条件在新旧机房间拉光纤线(就是光交用的线)?线长能控制在250米以内吗?毕竟在厂区拉线可能会有限制,不是想拉就拉的,而距离一般也不能走直线距离。收起
IT咨询服务 · 2015-01-19
浏览1272
yhsihyhsih  系统运维工程师 , 某网络公司
关于在线迁移AIX的知识建议你看看这一篇 http://www.ibm.com/developerwork ... PM_troubleshooting/但是你想实现的系统在线迁移中的问题还远不止服务器迁移这一块,你的前端还有F5,那玩意你也打算再买一套新的再新机房中吗?F5我没有折腾过,不清楚该怎么处理。要不然停机还是...显示全部
关于在线迁移AIX的知识建议你看看这一篇 http://www.ibm.com/developerwork ... PM_troubleshooting/

但是你想实现的系统在线迁移中的问题还远不止服务器迁移这一块,你的前端还有F5,那玩意你也打算再买一套新的再新机房中吗?F5我没有折腾过,不清楚该怎么处理。要不然停机还是难免的收起
零售/批发 · 2015-01-19
浏览1135
yhsihyhsih  系统运维工程师 , 某网络公司
回复 29# hufeng719 完全不停机的前提是你已经做好了虚拟化的工作,把现在运行在物理机上运行的系统迁移到虚拟化平台上是需要停机的,虚拟化完成后,就可以实现不停机迁移了,还有我有说需要再购买一套V5000或V7000的存储和两台光纤交换...显示全部
回复 29# hufeng719

完全不停机的前提是你已经做好了虚拟化的工作,把现在运行在物理机上运行的系统迁移到虚拟化平台上是需要停机的,虚拟化完成后,就可以实现不停机迁移了,还有我有说需要再购买一套V5000或V7000的存储和两台光纤交换收起
零售/批发 · 2015-01-19
浏览1030
hufeng719hufeng719  系统工程师 , 某钢铁企业
回复 26# yhsih 既然有这种“在线迁移完全不停机”的可能,我们为什么还要选择停机呢。。。能把方案说的具体点吗?我觉得再怎么搞虚拟化,单存储也是白搭的吧。停机不停机也不是由于负载多少决定的吧。。这个运行的集群就是为公司ERP服务的,试想如果ERP停了,整个办公楼包括财务...显示全部
回复 26# yhsih

既然有这种“在线迁移完全不停机”的可能,我们为什么还要选择停机呢。。。能把方案说的具体点吗?我觉得再怎么搞虚拟化,单存储也是白搭的吧。停机不停机也不是由于负载多少决定的吧。。这个运行的集群就是为公司ERP服务的,试想如果ERP停了,整个办公楼包括财务、销售、结算、成本、统计等等各个部门的人都不能正常办公了,现场车辆都等着发不了货,因为即使装车了,数据传不到ERP上,也不能作出库销账的。如果ERP停了会影响到各个方方面面的,所以最好别停。当然如果必须,停个1小时左右也是可以忍受的。收起
能源采矿 · 2015-01-19
浏览1087
tong2012tong2012  系统工程师 , 中国航空
回复 24# hufeng719     当然有的,这种模块是多模的,中心波长一般是850nm, 光纤直径有两个规格的,传输距离一个是550米,一个是275米。单模的模块,支持的传输距离会更远。显示全部
回复 24# hufeng719


    当然有的,这种模块是多模的,中心波长一般是850nm, 光纤直径有两个规格的,传输距离一个是550米,一个是275米。

单模的模块,支持的传输距离会更远。收起
系统集成 · 2015-01-19
浏览1068
tong2012tong2012  系统工程师 , 中国航空
回复 25# hufeng719     把新磁阵接到数据库主机上,PV搞成一样大小的,加到目前的数据库用的卷组当中,然后做PV的mirror, 这个是AIX系统下面的操作了,在替换磁阵中,经常会用到这种方式。...显示全部
回复 25# hufeng719


    把新磁阵接到数据库主机上,PV搞成一样大小的,加到目前的数据库用的卷组当中,然后做PV的mirror, 这个是AIX系统下面的操作了,在替换磁阵中,经常会用到这种方式。收起
系统集成 · 2015-01-19
浏览1044
yhsihyhsih  系统运维工程师 , 某网络公司
就你目前的服务器和相应的应用配置来看非常简单,估计负载真没有多大,不知道你为什么特别强调高大上的不停机迁移(目前你的数据库估计不支持,如果是oracle rac还有希望)。不过你可以试一试PowerVM虚拟化来实现你的需求(有点另类)因为你的系统是WAS5.1和DB2,我估计你原有系统是5到6...显示全部
就你目前的服务器和相应的应用配置来看非常简单,估计负载真没有多大,不知道你为什么特别强调高大上的不停机迁移(目前你的数据库估计不支持,如果是oracle rac还有希望)。

不过你可以试一试PowerVM虚拟化来实现你的需求(有点另类)
因为你的系统是WAS5.1和DB2,我估计你原有系统是5到6年前开发的,所以在目前的740上运行完全无法发挥服务器应有的处理能力。一台P740上就足够了运行你现在业务的3台小机运行的程序。建议购买PowerVM许可并增加服务器内存,购买一套新的存储服务器V7000或者V5000。

1、将所有服务器迁移到虚拟机环境下运行(这一过程需要短暂停机)
2、对个虚拟机上运行的系统用 mirrorvg 做一套克隆版 ,
3、将空出一台P740搬迁到新机房安装好PowerVM环境,将克隆的虚拟机在新的存储上运行起来
4、申请停机时间窗口,对数据库备份,到新机房做数据恢复,新机房服务器运行验证。
(如果两边机房拉有光纤也可以实现在线迁移完全不停机)收起
零售/批发 · 2015-01-19
浏览1159
hufeng719hufeng719  系统工程师 , 某钢铁企业
回复 20# tong2012 差不多是这个样子。就是想搞两个机房下的hacmp。其他条件不用说肯定都全啊,我是说得多余的设备没有,新机房嘛搬迁之前什么空调,走线,网络环境肯定都是全准备好的啊。因为V7000不能动,我就想再买个的话,数据在线如何转移?...显示全部
回复 20# tong2012

差不多是这个样子。就是想搞两个机房下的hacmp。其他条件不用说肯定都全啊,我是说得多余的设备没有,新机房嘛搬迁之前什么空调,走线,网络环境肯定都是全准备好的啊。因为V7000不能动,我就想再买个的话,数据在线如何转移?收起
能源采矿 · 2015-01-19
浏览1046

提问者

hufeng719
系统工程师某钢铁企业
擅长领域: 数据库存储服务器

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-01-16
  • 关注会员:3 人
  • 问题浏览:38397
  • 最近回答:2015-02-05
  • X社区推广