aix系统巡检报告单
1、 机房环境检查
零地电压是否小于 1V
温度(摄氏 ℃)
10 ℃ - 40 ℃
湿度( % )
8% - 80%
电源线的母头是否为左零右火电压值是否为 240V
2、 查看硬件情况
检查设备故障灯,一般为橙色并有故障标志。
有没有异常声响,如硬盘、风扇等。
有没有破损的电缆等
3、 主机检查
1 )系统空间使用情况,文件系统是否有“满”。命令: df –k
2 )查看卷组信息,有没有 "stale" 状态的逻辑卷 命令: lsvg -l rootvg
3 )检查内存交换区 (paging space) 使用率是否超过 70% 命令: # lsps –s
#lsps – a
观察内存大小的命令: lsattr – El mem0
命令: vmstat 2 5
显示从系统启动到现在使用 fork (创建的进程)的数量 命令: vmstat - f
4 )当前操作系统版本 命令 : oslevel
5 ) 系统性能检查:
a) CPU 性能: 使用 Vmstat, topas 来检查
b) 内存使用情况:也是使用 topas, vmstat 来检查
c) 检查 IO 平衡使用情况:使用 iostat 来检查
d) 交换空间使用情况: 使用 lsps –a 来检查
6 )网络检查
netstat -i 查看网卡状态
Ierrs/Ipkts 和 Oerrs/Opkts 是否 >1%
ping host_name /IP Address 查看是否通和是否有丢包。
路由表 #netstat -rn 查看路由表是否正确, ping 各路由器是否通
核对主机名 : #hostname
#ifconfig -a
#lsattr –El inet0
7) 检查 dump 设置
#sysdumpdev –l
8 ) 检查系统合法 / 非法登陆情况
使用 Last 命令来检查来自登陆的地方。
9) 检查系统是否有巨大的 Core 文件生成
使用 find / -name core – print 来检查。对 Core 文件,一般直接删除就可以了。
10 )网卡的状态、 IP 地址、路由表等 命令: netstat –in
查看 /etc/hosts
11 )列出系统中已安装的网络适配器 命令: #lsdev -Cc adapter
列出系统中已配置的网络接口 命令: #lsdev -Cc if
12) snap -a 来搜索 AIX 系统的大部分配置信息
13) 查看 错误报告 命令: errpt , ssa_ela , errpt |more
errpt -a >/tmp/errpt_20071111.txt // 将错误导出 errpt -a > errptlog.txt
errpt 查看 aix 的错误日志
errpt -dH // 硬件故障
errpt -dS // 软件故障
errpt –a | pg // 获得所有错误日志的详细报告
14 )有否发给 root 用户的错误报告 (mail)
15 )查看系统信息 命令: lsconf |more
lsdev -Cc processor
lsattr -El procX
prtconf |more
bindprocessor -q
16 )检查 hacmp.out,smit.log,boot.log 命令:
lssrc -g cluster 看一下 hacmp.out 命令: tail -f /tmp/hacmp.out
在 tmp 里面查看有无 smit.log ,用 vi 查看
boot.log 查看: # alog -o -t boot
17 )查看卷组信息,有没有 "stale" 状态的逻辑卷 命令: lsvg -l rootvg
18 )使用 iostat 命令监控 I/O 命令: iostat 1 2
19) 查看系统定时备份情况 命令: crontab –l
20)HACMP
检查 Cluster 是否运行正常
Cluster 进程是否运行: #lssrc –g cluster ,至少两个进程,且为 active 。
IP 地址是否获取: #netstat –i ,看 boot IP 是否变为 service ip 。
VG 是否 varyon : #lsvg – o
文件系统是否 mount : #mount
应用进程是否启动: #ps – ef | grep app_name
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞2
添加新评论0 条评论