EMCClariion CX 巡检操作手册
文档资料信息
文档适用范围
EMC CX200/300/400/500/600/700
版本历史
一、 EMC Clariion CX产品介绍(HighSource维保产品)
1.1
CX200 / 300 /400 / 500 基本部件及状态灯介绍
(四款产品均为DPE 架构,除SP的前端和后端端口数量有差别外,基本一样,下图为CX500
的DPE)
(1) BE0 – 后端总线端口0(HSSDC)----连接DPE和DAE
(2) BE1 –后端总线端口1(HSSDC)----连接DPE和DAE
(3) 两个前端 2Gb 端口(FC) 每个Storage Processor
(4) Enclosure 状态灯-绿色(电源灯),黄灯(错误灯或可用于检测启动过程)
(5) 10/100 以太网管理端口
(6) Serial Mgmt Port (RJ-45)-获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP的启动
(7) SPS Monitoring Port-连接SPS的串口,用于SP与SPS之间的通讯和控制
DiskArray Enclosure (DAE) – 后视图
[i]
Two Link Control Card (LCC)
(1) LCC 状态灯-绿色表示电源,黄色表示有错误
(2) Expansion 端口(HSSDC)---灯亮表示有信号
(3) 光纤环路ID指示灯 (Loop ID LED)----0,1,2,3, 表示后端连接的光纤换路(Loop) ID
(4) Primary 端口(HSSDC)---灯亮表示有信号
Two DAE 电源模块
(5) 两个集成了风扇的电源模块
(6) 风扇错误灯(黄色)
(7) 电源状态灯(绿色-有电,黄色-有错)
(8) 交流电源输入开关,对DAE-OS,DPE或SPE关电,应使用此开关
(9) Enclosure 地址开关-如是DAE-OS的Enclosure,则其必须被设置为0
Disk Array Enclosure (DAE)– 前视图
盘柜―共可容纳15个双端口的磁盘
(10) 硬盘状态灯-绿灯表示连接状态,闪烁表示磁盘活动状态
-黄灯表示磁盘报错
(11) 盘柜状态灯-绿灯表示供电正常,黄灯表示盘柜有错误
(12) Slot0-4 ,共5块DAE-OS Vault Drives(CX-2GBDAE-OS Only)
1.2
CX600 / 700 基本部件及状态灯介绍
Storage Processor Enclosure (SPE)--前视图
(2) 风扇模块错误灯(黄灯亮表示有错误,面板上看不见,需拆下面板才能看见)
(3) SPE 电源指示灯 (绿灯)
SPE 错误指示灯 (黄灯)
Storage Processor Enclosure (SPE)--后视图
1. Storage Processors A
2. Storage Processors B
3. 2个可热拔插的电源 (active/active, n+1)
Storage Processor (SP)—细节图
(1) 4 个前端(连主机)2Gb FC 端口,每个 Storage Processor
(2) 4个后端(连磁盘柜DAE) 2Gb FC 端口
(3) 10/100 局域网管理端口
(4) SP Status LEDs--用于SP启动检测和检查SP的健康状态
(5) Port80h Card--在SP主板上,用与开机自检,
(6) SPS Monitoring Port--连接SPS的串口,用于SP与SPS之间的通讯和控制
(7) Serial/PPP Port--获取动态IP地址进行维护或也可通过HyperTerminal软件检测SP启动。
1.3
CX 系列Standby Power Supply(SPS)接口及状态灯介绍
(1) 电源开关
(2) 交流电源输入
(3) SPE & 启动盘所在DAE 的交流输出
(4) SPS 监测端口--连接SP 的串口,用于SP 与SPS 之间的通讯和控制
(5) 状态灯 (从下至上)
内部监测灯—亮黄色表示SPS 内部监测出错
更换SPS 指示灯—亮黄色表示电池寿命已到或者自检出错
电池供电指示灯--当SPS 给SP 或DAE OS 供电时亮黄色
电源灯--当SPS 充满电后亮常绿,当SPS 电池被充电时闪绿色
二、 EMC Clariion CX产品巡检
2.1 使用Navisphere 查看存储的状态
登陆方式:通过IE浏览器输入SP 的IP地址
(Navisphere默认账号:admin 默认口令:password)
T:一个或者多个部件处于Transition 状态,比如LUN 正在Rebuilding,SPS 正在充电
F:一个或者多个部件出现故障,注意,存储刚加电,由于SPS 充电,也会出现F 状态
X:存储系统不可访问,比如网络连接断开等情况
?:当前Navishper 版本不支持对该存储系统进行管理
举例如下:
Array in Transition
Array Faulted
Array Inaccessible
如在 Navisphere 发现有报错,检查 CX磁盘阵列错误的简单方法
1、右击存储,选择fault,会显示具体报错信息
2、展开Physical 项,可以定位具体故障部件
3、Clariion 每个部件都有独立的故障指示灯,在Navishpere发现错误后,可以观察存储故障部件的错误指示灯进一步确认
使用 Navisphere 查看日志
2.2 如何收集日志
2.2.1 利用CLI命令行收集zip文件
1、进入Navisphere CLI 目录,对两个sp 执行spcollect 指令,执行成功后无任何提示
C:Program FilesEmcNavisphere CLI>navicli-h spa_ip spcollect
C:Program FilesEmcNavisphere CLI>navicli-h spb_ip spcollect[/i]
2、五分钟后执行命令(提醒:一定要等足够长的时间,因为SPcollect生成的时间比较长)
[i]C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles –list[/i]
3、注意查看最新的zip 文件是否生成, 一般格式为:
[i]CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip,
也就是:序列号+SP名字+日期时间的zip 文件,也有可能是: SP名字+序列号+日期时间的zip 文件
4、获取最新的zip 文件,执行命令
C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles -retrieve -path d:splog
-path 参数指定日志保存目录,默认在C:Documents and SettingsAdministrator(XP系统)
-retriever参数指定要收取的文件,如果没有指定文件名,则会出现选择文件的提示,注意,每一个文件前面都对应一个编号,比如CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip前面对应的是10,则输入10,
回车后确认后,会自动将文件存放到d:splog目录中
5、用同样的方法收集另一个SP 的SPcollect
注:如果没有安装classic navicli 或者存储端禁用了classic navicli(Clariion 4 系列默认禁止了
classic navicli 模式),请使用securenaviseccli 指令连接
C:Program FilesEmcNavisphere CLI> naviseccli –user xxx –password xxx –scope 0 -h spa_ipspcollect
xxx 表示用户名和密码,除需要指定帐号和口令外,其余命令格式同classic navicli 一样
2.2.2 利用CLI命令行收集log文件
1、进入Navisphere CLI 目录,分别在两个sp上执行getlog 指令
C:Program FilesEmcNavisphere CLI>navicli-h spa_ip getlog -200> spa_log.txt
C:Program FilesEmcNavisphere CLI>navicli-h spb_ip getlog -200> spa_log.txt
2、两分钟后执行命令
C:Program FilesEmcNavisphere CLI>navicli-h spa_ip managefiles –list[/i]
2.2.3 Navishpere 中收集日志
1、打开IE 浏览器,在地址栏输入阵列IP 地址,输入用户名、密码
2、在 Navisphere 界面右键单击“SP A”,点击“SP Collect”,在弹出的对话框中点击“OK”
3、五分钟后在Navisphere 界面右击“SP A”,点击“File Transfer Manager”,弹出对话框, (注:在点击“File Transfer Manager”之前,要等待足够的时间,因为生成SPcollect 的时间会比较长。
4、上一步点击“SP Collect” 弹出操作成功的对话框,这只是SP Collect 命令发送成功,而不是SP
Collect 已经收集成功)
5、在弹出的对话框中左侧选中最新的“zip”文件,点击对话框中右侧“Browse”按钮,选择文件输出位置,点击对话框中下侧“Transfer”按钮传送文件,在对话框右侧观察文件传送状态,如下
6、按照同样的方法收集SP B 的SPcollect
2.3 使用CAP2分析数据
CAP2 是的SPcollect数据分析工具,能够查看设备的配置信息以及部件状态。
1、运行CAP2 程序(CAP2的运行需要系统安装Java Runtime Environmet)
2、点击File – Open,找到收集下来的.zip数据
3、通过Issues 标签,查看报错
[i]Severity—Critical:必须要处理问题
Severity—Warning:需要处理的问题。
Severity—Infomational:参考信息。
4、通过Host标签,查看连接主机的链路状态(存在问题的链路,状态会显示NO)
5、通过Drive Modules标签,查看硬盘状态。
三、EMC Clariion CX常见故障处理
3.1 硬盘故障的处理
CX系列存储一般在二种情况下需要换盘,一为硬盘已经损坏(亮黄灯),二为频繁报DIsk softmedia error错误,第一种情况很简单,直接去现场热拔插换硬盘即可,第二种情况其实硬盘还没有硬件损坏,指示灯仍正常,这种情况换硬盘需要多点步骤,下面是实际更换过程的方法:
1、 登陆Navisphere,找到相应需要更换的硬盘(存储->;Physical->Bus x Enclosure x->Disks),然后右键执行copy to hot Spare,即把需要更换硬盘上的数据copy到hotspare盘上。
2、在执行第一步操作后,存储的图标会变成带一个“T”,这表示数据正在copy,还不能换盘,需继续等待,大概需要几十分钟。
3、等到存储的图标从“T”变为“F”后,需要更换的硬盘指示灯变为桔黄色,这表示已经可以拔出这块坏盘了。
4、拔出坏盘,换入新盘,注意比较一下二块盘的型号是否一致,如转数,接口,容量。
5、换入新盘后,硬盘指示灯变为绿色,并快速闪烁,表示存储已经在重建数据,把数据从HotSpare盘上恢复到这块新盘上。
6、从存储的console页面上也能看到,存储的图标又变为“T”,大约几十分钟后,重建完成,图标T消失,恢复正常。
7、详细过程从sp的log上也能看到。
更换硬盘流程:
1.用命令先收集两个SP的数据,然后用CAP2打开,看一下RAIDGroup Layout有没有做raid,然后看DriveModule硬盘的状态,故障硬盘一般是failed。
2.然后在通过网页打开Naviphere Manager(默认admin,password)里确认一下硬盘的状态,查看vier events,SP的版本2.19.xx以上可以直接通过网页收集SP数据。
3.直接去热插拔那个位置的硬盘,一般故障硬盘亮黄灯。
4.硬盘绿灯闪,同步完成后,用navicli -h 172.16.9.5 getdisk x_x_x,确认一下状态。
5.再收集一下数据。
3.2 SPS故障的处理
故障现象,在Navisphere上其中一个standby power supply状态为F。
存储背面左边的电池(SPS)上有2个橙色灯亮,分别为REPLACEBATTERY LED和FAULT LED,电源状态灯和其余状态灯正常。
更换SPS时注意的事项:
* 确认Navisphere Manager 里面的 write cache 是不是disable .
* 更换好之后要确认write cache enabled
1、关闭故障SPS上的开关,不要拔线。
此时即断掉了其中一路电源供应,SPS的状态灯会灭掉,另一个SPS电池的ON-BATTERYLED亮起,等待大概几十秒后,另一个SPS的ON-BATTERYLED 灭掉,ACTIVELED开始慢闪。
2、此时才能开始拔线(顺序:AC-IN,AC-OUT,连接控制器的INTERFACE)。
3、从设备前面,拆开挡板,卸下故障SPS。(适用于CX700,CX300在后面抽出)
4、拆除SPS侧边的小挡板。
6、在新的SPS上装上侧边的小挡板。
7、装上新的SPS。注意要保证新SPS上的开关是在0位置,即关闭的。
8、接好电源线后(顺序:连接控制器的INTERFACE,AC-OUT,AC-IN)。
9、打开SPS-A的开关。
此时SPS-A和SPS-B的ACTIVELED都会慢闪。大约几分钟后,SPS-B的ACTIVE LED恢复常亮状态,只有SPS-A还在慢闪。
3.3 用串口设置SP的IP地址
用串口线连接EMC存储
它是一个两端都是母头9帧的交叉串口线,把它连接到你的笔记本电脑。
选择网络邻居à创建新的连接向导à设置高级连接à直连其他计算机à使用Guest帐号à起一个自己能识别的计算机名称à选择COM端口à这时能看到一个新建的连接à属性à常规à配置,修改使用115200速率,启用硬件流控
User:clariion
Pass: clariion!
SP设置
首先连接串口线至SP,打开PPP连接。
1、在IE中输入“Http://192.168.1.1/setup.hltm”(SP默认的IPAddress)。
2、修改SP的IP Address,Hostname,SubnetMask;重要的Peer Ip Address(SPB的IP Address);默认的端口号。
3、然后选择“Apply Settings”;SP重启。
连接串口线至SP,打开PPP连接。
1、在IE中输入“Http://192.168.1.1/setup.hltm”,选择“Restart Managerment Server”,确认重启“CIMOM”。
3.4 开关机详细步骤
开机前注意事项:
1.
磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插上硬盘和挡风板。
2.
开机前需确保――SPE或DPE至少要有一个正常工作的SP,每个DAE都至少要一块正常工作的LCC。
开机步骤:
1. 检查所有供电线路联接是否正常,是否有松动或改动并改正。
2. 从机柜顶部开始,由上至下打开所有DAE磁盘机箱的电源。
3. 打开SPE(或DPE)机箱上两个电源的开关(机柜内部)。
4. 打开机柜最底部两个电池(SPS)(CX300可以只有一个)的开关。
关机前注意事项:
1.警告: 请不要在关闭两个电池(SPS)的电源开关前,关闭SPE,DPE,DAE等盘柜的任何一个电源,否则很可能会导致严重错误,并造成数据丢失! (CX300可能只有一个SPS)。
2. 即使关闭两个电池(SPS)的电源开关后,也需要等待3分钟直到CX存储写缓存中的数据完全写入到硬盘上后,才可关闭 DAE,SPE或DPE等盘柜的电源。
3.停止所有对CX磁盘阵列访问的应用,以便所有的I/O能被从SP的写缓存写回到前5块盘上。
4.如果有UNIX服务器连接在CX磁盘阵列上,必须umount UNIX服务器所有与CX磁盘阵列
相关的文件系统。
磁盘阵列关机步骤:
1.关闭机柜最底部的两个电池开关并等待约3分钟直到CX存储写缓存中的数据完全写入到硬盘上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电,SPE或DPE机箱及DAE-OS磁盘机箱的电源灯熄灭。
2.关闭SPE或DPE机箱及DAE-OS磁盘机箱的电源开关 。
3.由下至上,关闭所有DAE磁盘机箱的开关(机柜内部) 。
4.关闭机柜后面两侧机柜总开关。
收起