真实环境下机房如何不停业务搬迁?(走进企业)

环境描述:
一、机房主要设备:
UPS电源机柜、ERP集群(共四台P系列小机(两台P740、两台P720))、F5负载均衡、TSM服务器一台(WinServer2003R2)、TS3310带库一台、V7000磁盘阵列一台、两台Cisco4948交换机、两台2498-B24光交。

二、设备连接情况:
四台小机AIX系统:AP01(P740)装有WAS5.1部署公司ERP系统
                       DB01(P740)装有DB2数据库,TSM代理程序
                       DI01(P720):数据交换中心DIServer。(下面各二级服务器上安装有DIClient,双方通过发行订阅关系进行数据传输)
                       TS01(P720)测试机。部署WAS、DB2、ERP系统,正式机程序上线前通过该测试机测试。(图中未标识)

1111111111111.jpg


四台小机通过光交与V7000存储相连,另外:四台小机还用过4948交换机与V7000相连。


V7000三个raid5组成一个stgpool,通过划分卷映射至小机AIX系统。

22222222222222222222.gif


平时业务:通过网线传输数据。Lan-Free备份时通过光纤传输数据。(这是个人理解,不知道对不对)

TSM服务器上装有tsm server1软件服务和AC服务。通过web界面可查看带库备份情况。

TS3310包括33盘数据带,2个清洗带,2个驱动器。

三、问题求助:

1.首先TSM Server在WinServer2003 R2系统上,在DB01(AIX6.1)上装有客户端程序和TSM Agent代理程序,AP01和DI01上都装有tsm客户端程序,正常备份时需要有dsm sche调度进程开启。

请问:能否结合这个实际情况将Lan-Free讲的具体点,我一直不太明白这块。在AIX上是如何安装配置tsm客户端的?两台小机AP01和DI01是如何通过DB01代理实现的备份调度?什么机制引起的?(请说的详细些,便于我们会员能够按您给的建议自己动手操作一遍,加强学习交流)

2.目前存储阵列V7000就一台,如果真要搬迁机房,在花费成本最低的情况下,如何才能保证业务不中断且数据是安全完整的?

若需要购买另一台V7000的话,如何才能使两台存储数据实时同步?另一台是全新的,如何具体操作呢?能否有详细步骤?

3.WAS在AIX上的具体安装部署配置步骤还不太明白?另外我们这个WAS版本5.1太低,能否给出个不停业务的情况下升级版本的具体方案?(可以利用HACMP)

4.另外在F5中通过脚本策略通过不同的WAS虚拟机访问不同的ERP模块画面,在WAS控制台共设置了6个应用服务器(JVM虚拟机),但虚拟机经常有宕机的情况,现场打印报表或者其他不明操作会导致虚拟机内存溢出,生成好多javacore或者heapdump文件,针对这点有没有好的监控WAS的软件?我们的WAS版本5.1,好多监控软件不支持,因为不熟悉所以跑着业务也不敢动手升级版本,如果出问题损失可就大了。

5.javacore和heapdump文件的分析有没有经验可以学习?IBM提供的分析工具你知道对我们这些不太懂代码的人来说查找问题根源比较费劲。

问题都是实际工作中遇到的,有高手大侠的话可以给大家一起解答下,共同学习进步。在此代表求知若渴的广大会员们谢谢你们了!

———————————————————————————————————————————————————

结合以上企业的问题,AIX专家俱乐部会举办一个:走进企业,共同解决企业实际IT难题活动。由于该问题比较多,需要时间来进行澄清需求,所以社区会员均可以回帖询问发帖者,你认为需求描述不清楚的地方或者你还需要了解的地方都可以询问,发帖者有义务需要每天进行回帖澄清会员的问题。

本次活动礼品由:AIX专家俱乐部提供。该企业实际问题由:某钢铁公司企业实际难题

活动目的:走进企业,让更多社区会员共同解决企业的实际IT难题;

澄清需求时间:1月16日—1月23日

提交解决方案或者解决思路时间:1月28日   (所有会员均可以参与,可以针对发帖者的一个或者多个问题进行撰写解决方案或者解决思路,字数不限。发帖者会从大家提交的思路或者方案中,评选一个最佳满意的方案。该方案即可成为本次活动的优胜方案。获奖者可以获得社区提供的精美礼品一份。

解决方案提交:参与社区ID号并附上解决方案作品邮件提交到:peibin.peng@twtgroup.com.cn

获奖公布时间:1月30日


本次获奖礼品图:



本期最佳实操解决方案奖获得者:“北京荣歆咨询”

参与62

51同行回答

zwz99999zwz99999系统工程师dcits
这个问题比较切近实际,大家可以充分发挥想想空间,看怎么来解决这个问题!显示全部
这个问题比较切近实际,大家可以充分发挥想想空间,看怎么来解决这个问题!收起
系统集成 · 2015-01-16
浏览950
powertiandipowertiandi联盟成员系统架构师李宁(中国)体育用品有限公司
不停的话就就再建设一套(或单击环境),备份恢复或者v7000 同步,否则你这个环境不满足不停机的需求的。显示全部
不停的话就就再建设一套(或单击环境),备份恢复或者v7000 同步,否则你这个环境不满足不停机的需求的。收起
互联网服务 · 2015-01-16
浏览1933
hufeng719hufeng719联盟成员系统工程师某钢铁企业
有没有好办法不停机呢?两台V7000能否实现数据在线迁移呢?而且能否把业务切换到备机上运行呢,这是个难点。中间停个几分钟也可以啊,停机搬设备那时间可就长了显示全部
有没有好办法不停机呢?
两台V7000能否实现数据在线迁移呢?而且能否把业务切换到备机上运行呢,这是个难点。中间停个几分钟也可以啊,停机搬设备那时间可就长了收起
能源采矿 · 2015-01-16
浏览1860
powertiandipowertiandi联盟成员系统架构师李宁(中国)体育用品有限公司
回复 5# hufeng719 可以停机的话,网络提前做好,系统备份和数据备份完毕。。只是一个设备换个地方重新启动的问题,那就简单多了,直接弄即可,不用费太大心思。一天足以。。。快的话半天应该就差不多了...显示全部
回复 5# hufeng719

可以停机的话,网络提前做好,系统备份和数据备份完毕。。

只是一个设备换个地方重新启动的问题,那就简单多了,直接弄即可,不用费太大心思。

一天足以。。。快的话半天应该就差不多了收起
互联网服务 · 2015-01-16
浏览2069
keller01keller01系统工程师无业
存储这边,建议可以上SVC,以后方便整体存储的统一管理显示全部
存储这边,建议可以上SVC,以后方便整体存储的统一管理收起
互联网服务 · 2015-01-16
浏览1981
hufeng719hufeng719联盟成员系统工程师某钢铁企业
回复 4# l7859485 是的,我们这边存储是一大隐患。以后的规划肯定还是必须买一台备用的。显示全部
回复 4# l7859485
是的,我们这边存储是一大隐患。以后的规划肯定还是必须买一台备用的。收起
能源采矿 · 2015-01-16
浏览2462
keller01keller01系统工程师无业
1、按照你所提供的拓扑图中设备是没办法达到不停业务迁移(例:双活数据中心)。那么如果要停的话,就像楼上兄弟所提出的你允许停机的时间窗口有哪些?或者说对业务在进行细分,核心业务允许停机的最大时间是多少,边缘业务的允许停机的最大时间是多少?根据业务类型,分批次迁移。2、机房...显示全部
1、按照你所提供的拓扑图中设备是没办法达到不停业务迁移(例:双活数据中心)。那么如果要停的话,就像楼上兄弟所提出的你允许停机的时间窗口有哪些?或者说对业务在进行细分,核心业务允许停机的最大时间是多少,边缘业务的允许停机的最大时间是多少?根据业务类型,分批次迁移。
2、机房搬迁最重要的是整个搬迁规划,如果是将老设备迁移至新机房,需要做好数据的备份(例:小机的系统备份,数据库的备份),拓扑中的小机数量不多,如果有多块冗余磁盘的话可以,可将各小机的系统克隆一份作为备用,以防搬迁过程中出现故障而进行恢复。如无多余磁盘可考虑采用NIM方式对各小机的操作系统进行备份。
3、新购V7000采用同步说明距离不是很远,可将老设备数据同步至新设备后,在将新设备搬迁至新机房,与老设备进行对接测试。(此操作可分批次测试。)
4、如果同时能采用SVC的话可能中间操作会省很多事情。具体可以了查阅SVC相关资料。
5、软件问题由于本人不擅长,还请达人相助。
目前我能想到就这些。收起
互联网服务 · 2015-01-16
浏览2653
hufeng719hufeng719联盟成员系统工程师某钢铁企业
回复 3# powertiandi 谢谢这位大哥指点。1.如果搬迁,时间肯定不会超过一周,很有可能加班加点两天不休息就能基本完成。2.新机房距离现在的机房也就200米,从一幢楼的7层换到另一幢新楼的3层.网络通讯方面不用考虑肯定要铺设的。新机房内只有新机柜,没有任何其他设备,如果需要什...显示全部
回复 3# powertiandi
谢谢这位大哥指点。
1.如果搬迁,时间肯定不会超过一周,很有可能加班加点两天不休息就能基本完成。
2.新机房距离现在的机房也就200米,从一幢楼的7层换到另一幢新楼的3层.网络通讯方面不用考虑肯定要铺设的。新机房内只有新机柜,没有任何其他设备,如果需要什么设备,大家可以考虑到方案中。目标就是企业花费成本最低的情况下尽量不停业务把迁移任务完成,没有严格的规定。(当然如果非停不可就要考虑停机时间尽量少)【新机房可以购全套备用设备搭建好环境后把数据迁移过去就行,也可以只购买台V7000存储,利用原有的冗余交换机和光交各一台进行迁移,小机方面不要忘了HACMP可以切换运行的,这些都可以作为不同的迁移方案】
3.tsm LAN-Free备份,我的想法是谁亲手配置过的可以给大家一起分享下步骤。现在的环境是TSMserver在win环境下,客户端和代理在AIX环境下。还是有点区别的。
4.新机房网络方面不用大家考虑,跟现有网络和现场业务全通的。
5.WAS的配置确实很多,如果谁能提供一个在AIX环境下的安装配置详细步骤,应该更好。
6.WAS版本的升级我们的原则也是尽量不影响业务。大家无论出什么方案都应该充分考虑如何利用好现有的资源。【也可以先升级测试机的WAS版本运行一段时间是否正常再升级正式机等等,有什么好的升级方法步骤,大家可以讨论】
7.javacore和heapdump文件会经常出现的,如果每次都是发给开发商分析,总是受制于人,而且他们也只会告诉你哪出了问题,也不会告诉你如何查出来的。我们这边有软件开发人员。【都是维护ERP的,专业分析他们也不太会。我的想法是大侠指点一二更好】收起
能源采矿 · 2015-01-16
浏览2564
l7859485l7859485项目经理hefi
先顶一下,问题是比较多。关键还有这句“如果出问题损失可就大了”,怎么跑的还都是单设备,没有冗余,存储坏了你们怎么办?显示全部
先顶一下,问题是比较多。
关键还有这句“如果出问题损失可就大了”,怎么跑的还都是单设备,没有冗余,存储坏了你们怎么办?收起
系统集成 · 2015-01-16
浏览2605
powertiandipowertiandi联盟成员系统架构师李宁(中国)体育用品有限公司
做一个比较客观的梳理,你的问题还真不少啊:1. 搬迁的时间窗口有多长?2. 搬迁是想原封不动的还用这些机器,还是机房有其他机器可以分担一下应用,还是说采购新设备。3. tsm lanfree和调度的问题(网络上有很多tsm配置的文档和原理介绍)4. 如果购买v7000 做同步的话,你现在设备的位置...显示全部
做一个比较客观的梳理,你的问题还真不少啊:

1. 搬迁的时间窗口有多长?
2. 搬迁是想原封不动的还用这些机器,还是机房有其他机器可以分担一下应用,还是说采购新设备。
3. tsm lanfree和调度的问题(网络上有很多tsm配置的文档和原理介绍)
4. 如果购买v7000 做同步的话,你现在设备的位置和目的位置有多远(拉光纤的成本)
5. was的配置在linux和aix 等系统平台上基本上没有大的区别。
6. 关于was,新版本和旧版本还有一定的兼容性(生产系统需要经过严格的测试才可以)
7.  关于was dump包的分析,你有java开发的经验吗,没有基本上没戏(需要很多基础知识),可以发给软件开发商寻求解决

还是等你明确了这些问题后,想清楚是否真的需要不停业务迁移。。。


如果真的需要不停机,那需要的东西可能远超过你的成本。。。。
如下方面需求准备:

1. 网络方面你需要打通(两天交换机间做好路由)
2. 应用方面建议新搭设一套,使用数据库恢复方式进行
3. 设备方面最起码也得有一套单机环境可以允许的设备(可以考虑设备租用的方式)收起
互联网服务 · 2015-01-16
浏览2540

提问者

hufeng719
系统工程师某钢铁企业
擅长领域: 数据库存储服务器

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-01-16
  • 关注会员:3 人
  • 问题浏览:38761
  • 最近回答:2015-02-05
  • X社区推广