IBM X系列服务器操作手册--收集日志

本资料无预览

如感兴趣请购买后下载

立即下载

资料简介:
在服务器维修中,CAG会要求收集各方面的日志来判断机器故障,需要收集的日志一般有DSA、RAID、BMC
1、DSA日志
(1)概述
“IBM 动态系统分析”(IBM Dynamic System Analysis)收集并分析系统信息,从而为诊断系统问题提供辅助。
DSA 收集以下方面的系统信息:
• 系统配置  
• 已安装的应用程序和最新的修订包  
• 设备驱动程序和系统服务  
• 网络接口和设置
• 性能数据和有关正在运行的进程的详细信息
• 包括 PCI 信息在内的硬件清单
• 重要的产品数据和固件信息
• SCSI 设备检测数据
• ServeRAID 配置
• 应用程序、系统、安全性、ServeRAID 以及服务处理器系统事件日志
此外,DSA 会创建一份合并的日志,使用户能从系统的不同日志来源中确定问题的前因后果。DSA 也会将系统上的设备驱动程序和固件与 UpdateXpress CD 上的版本进行比较,以生成一份差异汇总报告。
版本介绍:DSA有三个版本,一个版本是Windows Portable Edition(可移植版), 一个版本是Windows Installable Edition(安装版),第三个版是Bootable(启动版)
“DSA 可移植版”在受支持的系统上通过命令提示符运行,无需修改任何系统文件或系统设置。它在目标系统的临时空间中运行,并会在执行完成后删除所有的临时文件。可移植版的设计和打包方式决定了它只需临时使用系统资源,就能够在对资源使用敏感的客户环境中收集系统信息。   
“DSA 可安装版”会在系统上永久安装 DSA。这个版本使用与“可移植版”相似的命令提示符界面。利用“DSA 可安装版”,您还可以使用 UpdateXpress 比较分析功能。
“DSA 启动版”当机器无系统时,可以用该启动版启动来收集DSA信息。
优点:
• 使数据收集自动化并对基本数据进行组织和分析有助于减少问题确定时间,从而减少了宕机时间
• 使数据收集以及向 IBM Service 提供系统信息的过程自动化
• 根据 UpdateXpress 输入提供集成的分析,以便能快速识别低版本的固件和驱动程序

(2)使用方法
目前DSA Windows最新的版本为v2.10版,下载地址:
Portable Edition:
http://www-304.ibm.com/systems/s ... 27&brandind=5000008
Installable Edition:
http://www-304.ibm.com/systems/s ... 25&brandind=5000008
Bootable Edition(最新v2.02版):
http://www-304.ibm.com/systems/s ... 00&brandind=5000008

A、        Portable Edition
直接在windows系统下运行ibm_utl_dsa_211p_windows_i386.exe
默认保存在C:IBM_Support机器型号_20080325-140608下,运行index.html即可看到DSA的内容。
B、        Installable Edition
运行程序,它会自动安装到系统中,在开始菜单中运行das即可
C、Bootable Edition
在以上地址下载iso镜像文件,刻成光盘后启动机器,启动后包含如下提示:
    view - View DSA results.
    copy - Copy DSA results to removable media.
    ftp  - FTP DSA results to testcase.boulder.ibm.com.
    exit - Quit program.
    help - Display this help message.

Command detail:

o view - Displays the collected data on the local console in a text
          viewer. Note: To exit viewer, type :x then press enter.
o copy - This command presents the available removable media
          devices, eg. USB Key, for storing the DSA collected data.
o ftp  - Transfers the collected compressed XML data file to IBM
          Service.
o exit - Exits the DSA Bootable Edition menu, ejects the Bootable
          Edition media, and reboots the machine.
执行view可以查看机器DSA信息,执行copy,同时在机器上插入一个usb存储设备,即可将DSA保存下来。

2.RAID日志
RAID日志主要通过ServeRAID Manager来收集
ServeRAID Manager可以通过ServeRAID Support CD启动机器来运行,也可以通过ServeRAID Application CD安装到Windows系统中来运行。
进入ServeRAID Manager在左边的localhost(local system)处点击右键,选择save printable configuration(保存raid配置信息),默认保存文件名为raidcfg.log。对于Xserise机型,配有软驱,此文件就默认存入A盘(所以要准备好软盘或者双启动U盘);对于System X机器,标配无软驱,所以插入任何usb存储设备都可将此文件保存。
如选择save support archive,保存是raid运行日志,如果有任何errors,都可以通过此文件判断出。
该文件会自动保存为一个zip文件,打开该zip文件后,其中有个controller  log.txt文件
对于7系列以前的卡(包括7系列),controller  log.txt文件如下:
说明: 上表反应了SCSI总线上每个SCSI设备的运行异常情况统计:
Parity:        该项对应的是数据在SCSI总线传输时奇偶校验错误数,如果计数大于10则反应了SCSI线缆的错误;
Soft:        该项对应的是数据在读写过程中的软错误, 如果计数大于10则反应了盘体本身的错误;如果计数小于10,可以认为是在受的干扰或电流冲击下的个别现象,可以忽略不计;
Hard:        该项对应的是数据在读写过程中的硬错误, 如果计数大于10则反应了阵列卡本身的错误;
PFA:        该项对应的是预失效分析的报错, 如果是YES则需要更换相对应的硬盘;
MISC:        该项对应的是其他方面的报错, 如果计数大于10则反应了阵列卡的Device Driver或Firwmare/BIOS等方面造成的错误,需要相应的软件升级;
如果为8系列的卡,此文件内容如下:

Parity errors:反映了SCSI线缆的错误;
Link errors:反映了硬盘背板错误;
HW errors:反映了阵列卡错误;
Medium errors:反映了硬盘自身的故障;

校验磁盘
此外,有些硬盘故障为隐形,所以需要通过校验硬盘来检测出问题,此时找到该磁盘,点右键,选择Identify physical drive系统会自动校验该磁盘,硬盘绿灯会闪烁,直到校验完毕后才会熄灭。当硬盘有故障时,此硬盘会亮黄灯,并出现感叹号,右键选择“Properties”,在status页面的PFA error状态为YES,表示硬盘自身有故障,需要更换硬盘。
3、BMC日志
BMC(Baseboard management controller)保存了系统板及附属设备的运行状况,通过该日志可以查看到部件运行状况。
A、更新 BMC firmware
更新到最新的BMC firmware可以避免出现问题。
注意:更新BMC的firmware不会改变user设置。
步骤如下:1、
http://www-304.ibm.com/systems/s ... 2T&brandind=5000008,对应机型下载最新的firmware。
2. BMC firmware更新多是启动软盘的形式,(一个EXE文件),也可以是一个ISO image,可刻成CD。
3. 插入更新盘,启动服务器。
4. BMC firmware更新自动执行。
5. 更新BMC firmware后,可以用更新盘来配置BMC。
6. 配置BMC后,取走更新盘,重启服务器。

B、配置BMC
方法一: 用 BMC_CFG 配置 BMC (部分服务器由于BMC软盘里没有BMC_CFG文件,所以用lancfg)
1 用firmware更新盘中的bmc_cfg.exe配置工具。
Bmc_cfg主要是一个排错工具,也可以用来查看和修改BMC配置。存在于更新盘中,不能作为独立的工具使用
可配置如下设置,以实现BMC的通信:
IP Address,Subnet mask,Default gateway,Alert notification和alert destination settings。
建议ip:10.1.1.97    Subnet mask:255.0.0.0
建议更改默认的user ID和password(账号USERID 密码PASSWORD)。
要运行bmc_cfg:
1. 如果刚更新完BMC的firmware,退出更新工具,回到DOS提示符。如果没有,则用更新盘启动服务器,当问是否更新时,选No。
2. 在DOS提示符,运行bmc_cfg。如下图


开始可以用lancfg(LAN Configuration)工具来配置BMC。一旦设置好网络后,就可以用IBM Director来配置user ID,password,和alert-forwarding特性。

方法二: 用 lancfg 配置 BMC
可以用lancfg工具,来做所有的配置。此工具在用于升级BMC firmware的软盘或者CD中。
注意:
只能从升级BMC firmware的软盘或者CD中运行lancfg.exe,不要在Windows的DOS窗口中运行。
1. 在BMC firmware升级成功后,显示一个提示符,运行lancfg。
2. 按F10和方向键,选择窗口顶部的菜单。
3. 选择LanCfg,则屏幕显示如下图2-2

4. 按Tab编辑,并选OK。
– Host IP address
– Subnet mask
– Router IP address
建议ip:10.1.1.97    Subnet mask:255.0.0.0
建议更改默认的user ID和password(账号USERID 密码PASSWORD)。
注意: Host MAC Address不能更改。

方法三: 在 BIOS 中配置 BMC
BIOS中可以配置如下设置:
IP address,Subnet mask,Default gateway。
如果想修改默认的user ID和password,则要用bmc_cfg或者IBM Director。
按如下步骤用Bios配置BMC:
1. 服务器启动时按F1,进入Configuration and Setup utility。
2. 选Advanced Setup。
3. 选Baseboard Management Controller (BMC) Settings,如下图

4. 选BMC Network Configuration,如下图。

5. 输入IP address,subnet mask,和gateway addresses,再选Save Network Settings in BMC。
建议ip:10.1.1.97    Subnet mask:255.0.0.0
建议更改默认的user ID和password(账号USERID 密码PASSWORD)。

注:一些故障机器可能已无法开机,同时也从未配置过BMC ip,此时可以使用169.254.0.2,255.255.0.0连接。

C、收集BMC日志
方法一:用SmBridge收取
用反线将笔记本与服务器上BMC控制口(第一个网口,只要服务器有交流输入不必开机)连接
SmBridge (1.0.3.8)Download site:
http://www-304.ibm.com/systems/s ... 36&brandind=5000008

在命令行界面下,进入SmBridge软件安装后所在的目录,执行
smbridge -ip 10.1.1.97 -u USERID -p PASSW0RD sel get >bmclog.txt



方法二:用SvcCon收取
Svccon download site
http://www-1.ibm.com/support/docview.wss?uid=psg1MIGR-63877

-用反线将笔记本与服务器上BMC控制口(第一个网口,只要服务器有交流输入不必开机)连接
-在笔记本上运行SvcCon


点logon登陆后,点Dump SEL抓日志,或者点Clear SEL清日志

方法三: F2收取
启动Server F2里可以用软盘收取BMC日志,Hardware Info -> BMC Log

将导出的bmc log按要求发给CAG。

注意,并不是所有X系列服务器都有BMC功能,具体请查阅Serve HMM。

另外,X3650T机型,收取BMC不能使用上述方法,此机器需要按以下方法收集BMC。X3650T抓取SEL log指导
首先找出随机附带的Documentation and Resource CD(必须而可以找客户索取)放入机器的光驱内,启动机器,确认机器的第一启动是光驱。
   
开机后机器自动引导光盘进入下面界面,点击continue


选择Run SEL Viewer Utility,然后点击continue。




在弹出的窗口中输入要保存的文件名。然后按TAB键将光标切换到A盘,按回车保存(在机器没有接任何外置USB设备时A盘默认为62M闪存盘)。

正在保存日志。大约5秒后弹出的窗口自动关闭,保存日志完成。



在弹出的确认窗口中选中OK。

tsm.JPG


日志清理完毕,退出重启机器.
2012-08-06
浏览5622
下载0

已下载用户的评价

您还未下载该资料,不能发表评价;
查看我的 待评价资源
本资料还没有评价。

贡献者

X社区推广