真实环境下机房如何不停业务搬迁?(走进企业)

环境描述:一、机房主要设备:UPS电源机柜、ERP集群(共四台P系列小机(两台P740、两台P720))、F5负载均衡、TSM服务器一台(WinServer2003R2)、TS3310带库一台、V7000磁盘阵列一台、两台Cisco4948交换机、两台2498-B24光交。二、设备连接情况:四台小机AIX系统:AP01(P740)装有WAS5.1部署公...显示全部
环境描述:
一、机房主要设备:
UPS电源机柜、ERP集群(共四台P系列小机(两台P740、两台P720))、F5负载均衡、TSM服务器一台(WinServer2003R2)、TS3310带库一台、V7000磁盘阵列一台、两台Cisco4948交换机、两台2498-B24光交。

二、设备连接情况:
四台小机AIX系统:AP01(P740)装有WAS5.1部署公司ERP系统
                       DB01(P740)装有DB2数据库,TSM代理程序
                       DI01(P720):数据交换中心DIServer。(下面各二级服务器上安装有DIClient,双方通过发行订阅关系进行数据传输)
                       TS01(P720)测试机。部署WAS、DB2、ERP系统,正式机程序上线前通过该测试机测试。(图中未标识)

1111111111111.jpg


四台小机通过光交与V7000存储相连,另外:四台小机还用过4948交换机与V7000相连。


V7000三个raid5组成一个stgpool,通过划分卷映射至小机AIX系统。

22222222222222222222.gif


平时业务:通过网线传输数据。Lan-Free备份时通过光纤传输数据。(这是个人理解,不知道对不对)

TSM服务器上装有tsm server1软件服务和AC服务。通过web界面可查看带库备份情况。

TS3310包括33盘数据带,2个清洗带,2个驱动器。

三、问题求助:

1.首先TSM Server在WinServer2003 R2系统上,在DB01(AIX6.1)上装有客户端程序和TSM Agent代理程序,AP01和DI01上都装有tsm客户端程序,正常备份时需要有dsm sche调度进程开启。

请问:能否结合这个实际情况将Lan-Free讲的具体点,我一直不太明白这块。在AIX上是如何安装配置tsm客户端的?两台小机AP01和DI01是如何通过DB01代理实现的备份调度?什么机制引起的?(请说的详细些,便于我们会员能够按您给的建议自己动手操作一遍,加强学习交流)

2.目前存储阵列V7000就一台,如果真要搬迁机房,在花费成本最低的情况下,如何才能保证业务不中断且数据是安全完整的?

若需要购买另一台V7000的话,如何才能使两台存储数据实时同步?另一台是全新的,如何具体操作呢?能否有详细步骤?

3.WAS在AIX上的具体安装部署配置步骤还不太明白?另外我们这个WAS版本5.1太低,能否给出个不停业务的情况下升级版本的具体方案?(可以利用HACMP)

4.另外在F5中通过脚本策略通过不同的WAS虚拟机访问不同的ERP模块画面,在WAS控制台共设置了6个应用服务器(JVM虚拟机),但虚拟机经常有宕机的情况,现场打印报表或者其他不明操作会导致虚拟机内存溢出,生成好多javacore或者heapdump文件,针对这点有没有好的监控WAS的软件?我们的WAS版本5.1,好多监控软件不支持,因为不熟悉所以跑着业务也不敢动手升级版本,如果出问题损失可就大了。

5.javacore和heapdump文件的分析有没有经验可以学习?IBM提供的分析工具你知道对我们这些不太懂代码的人来说查找问题根源比较费劲。

问题都是实际工作中遇到的,有高手大侠的话可以给大家一起解答下,共同学习进步。在此代表求知若渴的广大会员们谢谢你们了!

———————————————————————————————————————————————————

结合以上企业的问题,AIX专家俱乐部会举办一个:走进企业,共同解决企业实际IT难题活动。由于该问题比较多,需要时间来进行澄清需求,所以社区会员均可以回帖询问发帖者,你认为需求描述不清楚的地方或者你还需要了解的地方都可以询问,发帖者有义务需要每天进行回帖澄清会员的问题。

本次活动礼品由:AIX专家俱乐部提供。该企业实际问题由:某钢铁公司企业实际难题

活动目的:走进企业,让更多社区会员共同解决企业的实际IT难题;

澄清需求时间:1月16日—1月23日

提交解决方案或者解决思路时间:1月28日   (所有会员均可以参与,可以针对发帖者的一个或者多个问题进行撰写解决方案或者解决思路,字数不限。发帖者会从大家提交的思路或者方案中,评选一个最佳满意的方案。该方案即可成为本次活动的优胜方案。获奖者可以获得社区提供的精美礼品一份。

解决方案提交:参与社区ID号并附上解决方案作品邮件提交到:peibin.peng@twtgroup.com.cn

获奖公布时间:1月30日


本次获奖礼品图:



本期最佳实操解决方案奖获得者:“北京荣歆咨询”

收起
参与62

查看其它 50 个回答wangql的回答

wangqlwangql系统工程师NULL
1. tsm东西太多,我给你说原理吧,理解了原理就容易了。直接详细到可以操作是不现实的
tsm是cs架构,备份哪些主机就在哪些主机上安装tsm客户端。tsm客户端可以备份普通文件和db2数据库,备份其他的东西需要安装额外的模块,如tsm for db模块、for erp模块、for mail模块等待。备份的时候通过网络传输数据。备份速度受制于网络带宽。
   如果数据量大,可以用lanfree模块。lanfree模块安装在要备份数据的主机上,要求安装lanfree模块的主机能看到驱动器,备份的时候数据通过san网络直接从主机备份到带库上。
   关于tsm调度,也是分两块
   1.需要在服务端定义调度、再将定义好的调度和执行调度的节点关联起来
   2.需要在安装了tsm客户端的主机上启动dsm sched进程(dsmcad也行),进程会按时向server询问(这是其中一种方式,还有server推送模式),当符合调度执行时间了,客户端就会执行相关的调度操作。


2. 我们做过相关搬迁业务。按你说的业务不中断、花费小这两个本身就矛盾的。
    业务肯定会有中断时间,只有一台v7000的情况下,成本最小的方法就是租用或利旧其他存储利用v7000的外部虚拟化功能将数据备份到外部存储上。做完测试后搬迁。
    另买一台v7000,实时同步有两种:一种存储间作同步镜像,类似存储容灾的那种。另一种是做Vdisk mirror。前者需license,后者不要。我们当成用的是vdm,停机时间最短。

3和4实际是一个问题,你的was确实太老了,老到一些监控软件都不能很好的支持。得先做升级测试,你was上布的应用和最新的jdk是否兼容等等都需要测试。 反而was的升级安装,参照info center的安装部分就行,或者网上一大把。

5. HeapAnalyzer和IBM Thread and Monitor Dump Analyzer for Java
IT咨询服务 · 2015-01-20
浏览3100

回答者

wangql
wangql41446
系统工程师NULL
擅长领域: 存储备份软件定义存储

wangql 最近回答过的问题

回答状态

  • 发布时间:2015-01-20
  • 关注会员:3 人
  • 回答浏览:3100
  • X社区推广