系统集成emc cx

EMC Clariion CX 巡检操作手册

EMCClariion CX 巡检操作手册文档资料信息[td=1,1,138]  服务名称:  [td=3,1,457]  EMC Clariion CX 巡检操作手册[/i]  [td=1,1,138]  客户服务代表:  [td=1,1,162]    [td=1,1,156]&nb...显示全部

EMCClariion CX 巡检操作手册


文档资料信息


[td=1,1,138]  

服务名称:

  [td=3,1,457]  

EMC Clariion CX 巡检操作手册[/i]

  
[td=1,1,138]  

客户服务代表:

  [td=1,1,162]  
  [td=1,1,156]  

文档版本号:

  [td=1,1,139]  

1.0

  

[td=1,1,138]  

服务阶段:

  [td=1,1,162]  
  [td=1,1,156]  

文档版本日期:

  [td=1,1,139]  

2011年07月01日

  

[td=1,1,138]  

准备者:

  [td=1,1,162]  
  [td=1,1,156]  

准备日期:

  [td=1,1,139]  

2011年07月01日

  

[td=1,1,138]  

审定者:

  [td=1,1,162]  
  [td=1,1,156]  

审定日期:

  [td=1,1,139]  
  

文档适用范围

EMC CX200/300/400/500/600/700

版本历史

  
[td=1,1,64]   

版本号:

   [td=1,1,114]   

版本日期:

   [td=1,1,64]   

修订者:

   [td=1,1,53]   

描述:

   [td=1,1,303]   

文件名:

   
[td=1,1,64]  

V1.0

  [td=1,1,114]  

2011.07.01

  [td=1,1,64]  
  [td=1,1,53]  
  [td=1,1,303]  

EMC Clariion CX 巡检操作手册.doc

  
[td=1,1,64]  
  [td=1,1,114]  
  [td=1,1,64]  
  [td=1,1,53]  
  [td=1,1,303]  
  
[td=1,1,64]  
  [td=1,1,114]  
  [td=1,1,64]  
  [td=1,1,53]  
  [td=1,1,303]  


一、 EMC Clariion CX产品介绍(HighSource维保产品)


1.1
CX200 / 300 /400 / 500 基本部件及状态灯介绍


(四款产品均为DPE 架构,除SP的前端和后端端口数量有差别外,基本一样,下图为CX500

的DPE)

(1) BE0 – 后端总线端口0(HSSDC)----连接DPE和DAE

(2) BE1 –后端总线端口1(HSSDC)----连接DPE和DAE

(3) 两个前端 2Gb 端口(FC) 每个Storage Processor

(4) Enclosure 状态灯-绿色(电源灯),黄灯(错误灯或可用于检测启动过程)

(5) 10/100 以太网管理端口

(6) Serial Mgmt Port (RJ-45)-获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动

(7) SPS Monitoring Port-连接SPS的串口,用于SP与SPS之间的通讯和控制


DiskArray Enclosure (DAE) – 后视图

[i]


Two Link Control Card (LCC)

(1) LCC 状态灯-绿色表示电源,黄色表示有错误

(2) Expansion 端口(HSSDC)---灯亮表示有信号

(3) 光纤环路ID指示灯 (Loop ID LED)----0,1,2,3, 表示后端连接的光纤换路(Loop) ID

(4) Primary 端口(HSSDC)---灯亮表示有信号


Two DAE 电源模块

(5) 两个集成了风扇的电源模块

(6) 风扇错误灯(黄色)

(7) 电源状态灯(绿色-有电,黄色-有错)

(8) 交流电源输入开关,对DAE-OS,DPE或SPE关电,应使用此开关

(9) Enclosure 地址开关-如是DAE-OS的Enclosure,则其必须被设置为0


Disk Array Enclosure (DAE)– 前视图

盘柜―共可容纳15个双端口的磁盘

(10) 硬盘状态灯-绿灯表示连接状态,闪烁表示磁盘活动状态

-黄灯表示磁盘报错

(11) 盘柜状态灯-绿灯表示供电正常,黄灯表示盘柜有错误

(12) Slot0-4 ,共5块DAE-OS Vault Drives(CX-2GBDAE-OS Only)


1.2
CX600 / 700 基本部件及状态灯介绍


Storage Processor Enclosure (SPE)--前视图


(1) 3个可热插拔的风扇模块

(2) 风扇模块错误灯(黄灯亮表示有错误,面板上看不见,需拆下面板才能看见)

(3) SPE 电源指示灯 (绿灯)

SPE 错误指示灯 (黄灯)


Storage Processor Enclosure (SPE)--后视图

1. Storage Processors A

2. Storage Processors B

3. 2个可热拔插的电源 (active/active, n+1)


Storage Processor (SP)—细节图

(1) 4 个前端(连主机)2Gb FC 端口,每个 Storage Processor

(2) 4个后端(连磁盘柜DAE) 2Gb FC 端口

(3) 10/100 局域网管理端口

(4) SP Status LEDs--用于SP启动检测和检查SP的健康状态

(5) Port80h Card--在SP主板上,用与开机自检,

(6) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制

(7) Serial/PPP Port--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP启动。


1.3
CX 系列Standby Power Supply(SPS)接口及状态灯介绍


(1) 电源开关

(2) 交流电源输入

(3) SPE & 启动盘所在DAE 的交流输出

(4) SPS 监测端口--连接SP 的串口,用于SP 与SPS 之间的通讯和控制

(5) 状态灯 (从下至上)

内部监测灯—亮黄色表示SPS 内部监测出错

更换SPS 指示灯—亮黄色表示电池寿命已到或者自检出错

电池供电指示灯--当SPS 给SP 或DAE OS 供电时亮黄色

电源灯--当SPS 充满电后亮常绿,当SPS 电池被充电时闪绿色


二、 EMC Clariion CX产品巡检


2.1 使用Navisphere 看存储的状态


登陆方式:通过IE浏览器输入SP 的IP地址

(Navisphere默认账号:admin 默认口令:password)



T:一个或者多个部件处于Transition 状态,比如LUN 正在Rebuilding,SPS 正在充电

F:一个或者多个部件出现故障,注意,存储刚加电,由于SPS 充电,也会出现F 状态

X:存储系统不可访问,比如网络连接断开等情况

?:当前Navishper 版本不支持对该存储系统进行管理


举例如下:


Array in Transition


Array Faulted



Array Inaccessible


如在 Navisphere 发现有报错,检查 CX磁盘阵列错误的简单方法

1、右击存储,选择fault,会显示具体报错信息

2、展开Physical 项,可以定位具体故障部件

3、Clariion 每个部件都有独立的故障指示灯,在Navishpere发现错误后,可以观察存储故障部件的错误指示灯进一步确认



使用 Navisphere 查看日志



2.2 如何收集日志


2.2.1 利用CLI命令行收集zip文件


1、进入Navisphere CLI 目录,对两个sp 执行spcollect 指令,执行成功后无任何提示

C:Program FilesEmcNavisphere CLI>navicli-h spa_ip spcollect

C:Program FilesEmcNavisphere CLI>navicli-h spb_ip spcollect[/i]


2、五分钟后执行命令(提醒:一定要等足够长的时间,因为SPcollect生成的时间比较长)

[i]C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles –list[/i]


3、注意查看最新的zip 文件是否生成, 一般格式为:

[i]CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip

也就是:序列号+SP名字+日期时间的zip 文件,也有可能是: SP名字+序列号+日期时间的zip 文件


4、获取最新的zip 文件,执行命令

C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles -retrieve -path d:splog


-path 参数指定日志保存目录,默认在C:Documents and SettingsAdministrator(XP系统)

-retriever参数指定要收取的文件,如果没有指定文件名,则会出现选择文件的提示,注意,每一个文件前面都对应一个编号,比如CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip前面对应的是10,则输入10,

回车后确认后,会自动将文件存放到d:splog目录中


5、用同样的方法收集另一个SP 的SPcollect

注:如果没有安装classic navicli 或者存储端禁用了classic navicli(Clariion 4 系列默认禁止了

classic navicli 模式),请使用securenaviseccli 指令连接

C:Program FilesEmcNavisphere CLI> naviseccli –user xxx –password xxx –scope 0 -h spa_ipspcollect

xxx 表示用户名和密码,除需要指定帐号和口令外,其余命令格式同classic navicli 一样


2.2.2 利用CLI命令行收集log文件


1、进入Navisphere CLI 目录,分别在两个sp上执行getlog 指令

C:Program FilesEmcNavisphere CLI>navicli-h spa_ip getlog -200> spa_log.txt

C:Program FilesEmcNavisphere CLI>navicli-h spb_ip getlog -200> spa_log.txt


2、两分钟后执行命令

C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles –list[/i]


2.2.3 Navishpere 中收集日志


1、打开IE 浏览器,在地址栏输入阵列IP 地址,输入用户名、密码

2、在 Navisphere 界面右键单击“SP A”,点击“SP Collect”,在弹出的对话框中点击“OK”


3、五分钟后在Navisphere 界面右击“SP A”,点击“File Transfer Manager”,弹出对话框, (注:在点击“File Transfer Manager”之前,要等待足够的时间,因为生成SPcollect 的时间会比较长。

4、上一步点击“SP Collect” 弹出操作成功的对话框,这只是SP Collect 命令发送成功,而不是SP

Collect 已经收集成功)



5、在弹出的对话框中左侧选中最新的“zip”文件,点击对话框中右侧“Browse”按钮,选择文件输出位置,点击对话框中下侧“Transfer”按钮传送文件,在对话框右侧观察文件传送状态,如下



6、按照同样的方法收集SP B 的SPcollect


2.3 使用CAP2分析数据


CAP2 是的SPcollect数据分析工具,能够查看设备的配置信息以及部件状态。

1、运行CAP2 程序(CAP2的运行需要系统安装Java Runtime Environmet)

2、点击File – Open,找到收集下来的.zip数据

3、通过Issues 标签,查看报错

[i]Severity—Critical:必须要处理问题

Severity—Warning:需要处理的问题。

Severity—Infomational:参考信息。



4、通过Host标签,查看连接主机的链路状态(存在问题的链路,状态会显示NO)


5、通过Drive Modules标签,查看硬盘状态。


三、EMC Clariion CX常见故障处理


3.1 硬盘故障的处理

CX系列存储一般在二种情况下需要换盘,一为硬盘已经损坏(亮黄灯),二为频繁报DIsk softmedia error错误,第一种情况很简单,直接去现场热拔插换硬盘即可,第二种情况其实硬盘还没有硬件损坏,指示灯仍正常,这种情况换硬盘需要多点步骤,下面是实际更换过程的方法:

1、 登陆Navisphere,找到相应需要更换的硬盘(存储->;Physical->Bus x Enclosure x->Disks),然后右键执行copy to hot Spare,即把需要更换硬盘上的数据copy到hotspare盘上。

2、在执行第一步操作后,存储的图标会变成带一个“T”,这表示数据正在copy,还不能换盘,需继续等待,大概需要几十分钟。

3、等到存储的图标从“T”变为“F”后,需要更换的硬盘指示灯变为桔黄色,这表示已经可以拔出这块坏盘了。

4、拔出坏盘,换入新盘,注意比较一下二块盘的型号是否一致,如转数,接口,容量。

5、换入新盘后,硬盘指示灯变为绿色,并快速闪烁,表示存储已经在重建数据,把数据从HotSpare盘上恢复到这块新盘上。

6、从存储的console页面上也能看到,存储的图标又变为“T”,大约几十分钟后,重建完成,图标T消失,恢复正常。

7、详细过程从sp的log上也能看到。

更换硬盘流程:

1.用命令先收集两个SP的数据,然后用CAP2打开,看一下RAIDGroup Layout有没有做raid,然后看DriveModule硬盘的状态,故障硬盘一般是failed。

2.然后在通过网页打开Naviphere Manager(默认admin,password)里确认一下硬盘的状态,查看vier events,SP的版本2.19.xx以上可以直接通过网页收集SP数据。

3.直接去热插拔那个位置的硬盘,一般故障硬盘亮黄灯。

4.硬盘绿灯闪,同步完成后,用navicli -h 172.16.9.5 getdisk x_x_x,确认一下状态。

5.再收集一下数据。


3.2 SPS故障的处理

故障现象,在Navisphere上其中一个standby power supply状态为F。

存储背面左边的电池(SPS)上有2个橙色灯亮,分别为REPLACEBATTERY LED和FAULT LED,电源状态灯和其余状态灯正常。

更换SPS时注意的事项:

* 确认Navisphere Manager 里面的 write cache 是不是disable .

* 更换好之后要确认write cache  enabled


1、关闭故障SPS上的开关,不要拔线。

此时即断掉了其中一路电源供应,SPS的状态灯会灭掉,另一个SPS电池的ON-BATTERYLED亮起,等待大概几十秒后,另一个SPS的ON-BATTERYLED  灭掉,ACTIVELED开始慢闪。

2、此时才能开始拔线(顺序:AC-IN,AC-OUT,连接控制器的INTERFACE)。

3、从设备前面,拆开挡板,卸下故障SPS。(适用于CX700,CX300在后面抽出)

4、拆除SPS侧边的小挡板。

6、在新的SPS上装上侧边的小挡板。

7、装上新的SPS。注意要保证新SPS上的开关是在0位置,即关闭的。

8、接好电源线后(顺序:连接控制器的INTERFACE,AC-OUT,AC-IN)。

9、打开SPS-A的开关。

此时SPS-A和SPS-B的ACTIVELED都会慢闪。大约几分钟后,SPS-B的ACTIVE LED恢复常亮状态,只有SPS-A还在慢闪。


3.3 用串口设置SP的IP地址


用串口线连接EMC存储
它是一个两端都是母头9帧的交叉串口线,把它连接到你的笔记本电脑。


选择网络邻居à创建新的连接向导à设置高级连接à直连其他计算机à使用Guest帐号à起一个自己能识别的计算机名称à选择COM端口à这时能看到一个新建的连接à属性à常规à配置,修改使用115200速率,启用硬件流控

User:clariion
Pass: clariion!


SP设置

首先连接串口线至SP,打开PPP连接。

1、在IE中输入“Http://192.168.1.1/setup.hltm”(SP默认的IPAddress)。

2、修改SP的IP Address,Hostname,SubnetMask;重要的Peer Ip Address(SPB的IP Address);默认的端口号。

3、然后选择“Apply Settings”;SP重启。  

连接串口线至SP,打开PPP连接。

1、在IE中输入“Http://192.168.1.1/setup.hltm”,选择“Restart Managerment Server”,确认重启“CIMOM”。


3.4 开关机详细步骤


开机前注意事项:

1.
磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插上硬盘和挡风板。

2.
开机前需确保――SPE或DPE至少要有一个正常工作的SP,每个DAE都至少要一块正常工作的LCC。


开机步骤:

1. 检查所有供电线路联接是否正常,是否有松动或改动并改正。

2. 从机柜顶部开始,由上至下打开所有DAE磁盘机箱的电源。

3. 打开SPE(或DPE)机箱上两个电源的开关(机柜内部)。

4. 打开机柜最底部两个电池(SPS)(CX300可以只有一个)的开关。


关机前注意事项:

1.警告: 请不要在关闭两个电池(SPS)的电源开关前,关闭SPE,DPE,DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失! (CX300可能只有一个SPS)。

2. 即使关闭两个电池(SPS)的电源开关后,也需要等待3分钟直到CX存储写缓存中的数据完全写入到硬盘上后,才可关闭    DAE,SPE或DPE等盘柜的电源。

3.停止所有对CX磁盘阵列访问的应用,以便所有的I/O能被从SP的写缓存写回到前5块盘上。

4.如果有UNIX服务器连接在CX磁盘阵列上,必须umount UNIX服务器所有与CX磁盘阵列

相关的文件系统。


磁盘阵列关机步骤:

1.关闭机柜最底部的两个电池开关并等待约3分钟直到CX存储写缓存中的数据完全写入到硬盘上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电,SPE或DPE机箱及DAE-OS磁盘机箱的电源灯熄灭。

2.关闭SPE或DPE机箱及DAE-OS磁盘机箱的电源开关 。

3.由下至上,关闭所有DAE磁盘机箱的开关(机柜内部) 。

4.关闭机柜后面两侧机柜总开关。

收起
参与6

查看其它 3 个回答mytxy的回答

mytxymytxy系统工程师某某互联网公司
很稀缺资料
互联网服务 · 2014-05-23
浏览3967

回答者

mytxy
系统工程师某某互联网公司
擅长领域: 服务器系统运维小型机

mytxy 最近回答过的问题

回答状态

  • 发布时间:2014-05-23
  • 关注会员:1 人
  • 回答浏览:3967
  • X社区推广