系统集成AIX新手入门

记录点滴-与菜鸟s共勉

:lol 首先,向大家打个招呼,我是个刚入门的AIX菜鸟,以后靠大家多多帮助。    今天收到张涛GG的建议,在论坛中记录如后的学习、实践中的心得,在此向他表示感谢!    目的:记录学习AIX的过程,也如有缺漏、不严谨或者错误之处请老鸟们指出,像我一样的菜鸟们也能参...显示全部
:lol 首先,向大家打个招呼,我是个刚入门的AIX菜鸟,以后靠大家多多帮助。
    今天收到张涛GG的建议,在论坛中记录如后的学习、实践中的心得,在此向他表示感谢!
    目的:记录学习AIX的过程,也如有缺漏、不严谨或者错误之处请老鸟们指出,像我一样的菜鸟们也能参考下。
    让大家见笑了。
    PS:有问题可以一起讨论,最重要的是:如果我写的又错误,请各位快速指出,丢面子事小,出事故事大!
        第一次发帖,如果有违反规定之处,请版主先与我联系后再删帖,以便我拷走信息,谢谢!

¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥目录:1、设备巡检 (http://www.aixchina.net/club/viewthread.php?tid=6283&page=1&extra=page%3D1
      2、OpenSSH的安装配置  (http://www.aixchina.net/club/viewthread.php?tid=7349&extra=page%3D1&frombbs=1





¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥¥

1、设备巡检   2008-12-19  摘抄源于 菜鸟AIX成长日记

巡检一般又厂商或者代理商来做。
第一:首先是机房温度以及湿度的检查,当然这些一般情况都没问题。
         参考值:温度(摄氏 ℃)        10 ℃-40℃
                     湿度                           8% -80%
第二:就是关于电源的检测,这个只要不是新装机,一般没问题。
        参考值: 零-地电压        小于1V
                     火-地电压        200-240V
        补充:当然59系列的机器相间380V,相地240V。
第三:关于报错。


        主要查看硬件的永久性报错   #errpt -dH | pg
                软件的永久性报错   #errpt -dS | pg

                还有系统又没又报警灯(如果不正常,在后面的帖子将会细讲)
第三:机器的序列号:#uname -Mu
第四:操作系统版本:#oslevel -r      注:又时候不能使用是因为系统版本低的原因
第五:其他检测

执行sysdumpdev –l 检查dump是否设置为always allow sysdump
执行sysdumpdev –e检查当前dump大小应该为主dump设备的大小的80%以下
执行lsvg -l rootvg检查有否"stale"状态的逻辑卷
执行lsps -s检查内存交换区占用情况
执行df –k检查文件系统的分配状况,一般不要超过80%
执行lsdev –Cc disk检查硬盘状态为available
执行lsdev -Cc cdrom检查光驱状态为available
执行lsdev –Cc adapter检查PCI卡状态为available
执行lsdev –Cc tape检查磁带机状态为available
执行lsdev – Cc processor检查CPU状态为available
执行 lsattr –El sys0|grep autorestart  检查系统crash后是否自动重新启动
执行lsattr –El sys0|grep cpuguard检查CPU GUARD是否开启
执行lsattr –El mem0检查内存状态正常size=goodsize
执行 vmstat 2
iostat,topas观察us,sy,pi,po,内存占用率,硬盘读写速度等检查是否有性能瓶颈
执行netstat –innetstat –rn观察网络状态
执行entstat –d enX检测网卡运行速率与交换机速率是否匹配(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)
执行ping命令检查网络连接状况
执行lsdev –C|grep aio 检查异步IO是否可用
执行lssrc –g cluster查看是否有三个进程均为active状态(这个主要看起了几个HA的进程了,有的时候是一个或两个)
执行/usr/sbin/cluster/clstat –a查看cluster状态是否正常
检查/etc/hosts, 确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ip)
执行
more /usr/es/adm/cluster.log
more /usr/es/sbin/cluster/history/*
cat /tmp/hacmp.out

检查这三个日志中是否有error或者fail.

检查7133面板上的指示灯,如果黄灯亮则需要诊断问题
HOTspare 磁盘检测
1、检查是否有raid保护 # smitty ssaraid--->List All Defined SSA RAID Arrays
2、检查是否有Hot Spare # smitty ssaraid--->List Components in a Hot Spare Pool
对于7133,执行Smitty ssaraid List All Defined SSA RAID Arrays查看7133 raid状态,正常应该为good状态。
对于7133,执行Smitty ssaraidChange/Show Use of an SSA Physical Disk查看7133硬盘状态,正常应该为member或者spare状态
对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。
记录检查结果

基本就是这些命令吧,如果我有遗漏后面继续补充。

查看设备所有信息
#prtconf|more
显示每一个CPU的频率
#pmcycles -m
查看PV
#lsattr -El hdiskN  *N=1,2,3,...
查看内存
#bootinfo -r
或者先使用命令#  lsdev -Cc memory
再使用命令# lsattr -El memN    *N=1,2,3,...
查看每个内存的信息
# lscfg -vp | grep -ip memory | more
cpu (主频*数量)    #lsattr -El proc0

[ 本帖最后由 csh_140 于 2009-1-9 10:23 编辑 ]收起
参与9

查看其它 8 个回答csh_140的回答

csh_140csh_140项目经理福建长威
顺便记录下今天安装x3610操作系统碰到的问题

    首先,设备都是刚到货的新设备,一共4台。

1、问题:第一台用Server Guide 7.4.17做系统安装,设置好RAID0设备重
启后,设备死机,重启后设备无法进入引导。
解决办法:向IBM报修。
2、问题:第二台基于前一台经验后仍然使用Server Guide 7.4.17做系统安装,但这次不

配置RAID保持原有阵列,当Server Guide设置完成后设备重启,死机。

解决办法:换了张Server Guide 8.1.01盘,重启设备,系统正常引导,完成系统安装。
3、问题:第三台系统加电后设备出现连续蜂鸣的报警,当前面板报警灯没亮
解决办法:判断是内存没有插紧,重新拔插内存后,设备进入正常引导,完成系
                统安装。

4、第四台正常安装。


总结:出现问题的主要原因是Server Guide 版本不匹配。
心得:准备功夫一定要做足啊。:Q
系统集成 · 2008-12-20
浏览2705

回答者

csh_140
项目经理福建长威
擅长领域: 服务器AIXUnix

csh_140 最近回答过的问题

回答状态

  • 发布时间:2008-12-20
  • 关注会员:0 人
  • 回答浏览:2705
  • X社区推广