AIX突然异常关机,请问如何查询原因

一台P740小机通过POWER VM分区后,划分出2个服务器,OS:AIX 6.1。
刚才其中1台服务器突然关闭,而另一台服务器工作正常。(当时正在给其扩分区)
已通过HMC对突然关闭的服务器进行激活,目前HMC中状态长时间(5分钟+)停留在2700状态码

2700
Explanation
Configuring NPIV FC SCSI protocol device

PAFS02.png

PAFS02.png

请问:

  1. 状态码2700的解释为“Configuring NPIV FC SCSI protocol device”,目前保持在状态码2700已10分钟,该服务器尚无法连接,请问如何使其启动;
  2. 如何查询该服务器停机原因;

本人小白,见谅。

参与34

5同行回答

myciciymyciciyIT顾问某金融科技公司
你做的什么操作,扩分区?然后直接宕机了?显示全部

你做的什么操作,扩分区?然后直接宕机了?

收起
银行 · 2017-06-15
浏览7037
zwz99999zwz99999系统工程师dcits
从你操作上看是无错误,就是扩/ 和/VAR两个分区,另外你看你的rootvg 剩余空间还有多少,链接的是emc 存储,另外你可以试一下 down的那台机器是lpar吧,把网线、光纤线拔掉起一下再试试显示全部

从你操作上看是无错误,就是扩/ 和/VAR两个分区,另外你看你的rootvg 剩余空间还有多少,链接的是emc 存储,另外你可以试一下 down的那台机器是lpar吧,把网线、光纤线拔掉起一下再试试

收起
系统集成 · 2017-06-15
浏览7266
gemini8505 邀答
  • A、B机划分区方式应该是相同的,rootvg连接的不是EMC存储,是本地磁盘。 A机rootvg的PV为: # lsvg -p rootvg rootvg: PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION hdisk0 active 799 0 00..00..00..00..00 hdisk14 active 799 472 129..00..23..160..160 down的机器确实是lpar,但是上面还跑着SAP的生产环境,不敢拔网线和光纤线的说。。。
    2017-06-15
798683133yj798683133yj系统架构师政务云某公司
请详细描述下前后操作的过程?显示全部

请详细描述下前后操作的过程?

收起
金融其它 · 2017-06-15
浏览7247
  • 没有其他操作过程了,今天就是很偶然地登上去看看HA的配置。然后扩下分区,就这么华丽丽地宕机了。
    2017-06-15
  • # oslevel -s 6100-07-04-1216 HMC V7R7.5.0.0 请教您下,VIOS版本怎么查看呀
    2017-06-16
  • VIOS版本怎么查看$ioslevel, ha那个版本呢?那就把hacmp.out的日志贴出来看看
    2017-06-16
  • 服务器上执行ioslevel,没有这个命令 查到宕机时间点出现了一个hacmp.out文件,内容为:CLSTRMGR_KILL:0615133417:0615133717 # oslevel -s 6100-07-04-1216 # ioslevel ksh: ioslevel: not found. # find / -name '*ioslevel*' # find / -name '*hacmp.out*' -exec ls -lrt {} \; -rw-r--r-- 1 root system 618 Jan 30 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.1 -rw-r--r-- 1 root system 618 Jan 28 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.2 -rw-r--r-- 1 root system 618 Jan 16 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.3 -rw-r--r-- 1 root system 618 Jan 15 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.4 -rw-r--r-- 1 root system 618 Jan 05 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.5 -rw-r--r-- 1 root system 618 Jan 03 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.6 -rw-r--r-- 1 root system 618 Jan 01 2015 /tmp/ibmsupt/hacmp/ffdc.2016.06.16.11.01/hacmp/KPAF02/hacmp/halogfiles/hacmp.out.7 -rw-r--r-- 1 root system 0 Jun 16 00:00 /var/hacmp/log/hacmp.out -rw-r--r-- 1 root system 36 Jun 15 13:37 /var/hacmp/log/hacmp.out.1 -rw-r--r-- 1 root system 618 Feb 23 00:57 /var/hacmp/log/hacmp.out.2 -rw-r--r-- 1 root system 618 Feb 20 00:03 /var/hacmp/log/hacmp.out.3 -rw-r--r-- 1 root system 618 Feb 10 00:57 /var/hacmp/log/hacmp.out.4 -rw-r--r-- 1 root system 618 Feb 07 00:57 /var/hacmp/log/hacmp.out.5 -rw-r--r-- 1 root system 618 Feb 04 00:03 /var/hacmp/log/hacmp.out.6 -rw-r--r-- 1 root system 618 Feb 03 00:03 /var/hacmp/log/hacmp.out.7 # cat /var/hacmp/log/hacmp.out.1 CLSTRMGR_KILL:0615133417:0615133717 #
    2017-06-16
  • [此评论已删除]
    2017-06-16
  • HMC,VIOS版本各是多少?估计很有可能是bug引起的
    2017-07-03
gemini8505gemini8505系统工程师KOLUMB
宕掉的服务器称为B机,与另一台服务器A机组成HACMP集群宕机前我在B机上操作了chfs -a size加空间,具体操作如下:# lspv hdisk0 00f7b44a8cabd0d2 rootvg active hdisk1 none No...显示全部

宕掉的服务器称为B机,与另一台服务器A机组成HACMP集群

宕机前我在B机上操作了chfs -a size加空间,具体操作如下:

# lspv
hdisk0          00f7b44a8cabd0d2                    rootvg          active              
hdisk1          none                                None                                
hdisk2          none                                None                                
hdisk3          none                                None                                
hdisk4          none                                None                                
hdisk5          none                                None                                
hdisk6          none                                None                                
hdiskpower0     00f7b44a295e023c                    vgdb                                
hdiskpower1     00f7b44a29605111                    vgsap           active              
hdiskpower2     00f7b44a295c678e                    hbvg                                
hdisk13         00f7b44aa68f4471                    rootvg          active              
# lspv -p hdiskpower2
0516-010 : Volume group must be varied on; use varyonvg command.
# df -g
Filesystem    GB blocks      Free %Used    Iused %Iused Mounted on
/dev/hd4           6.00      0.29   96%    11260    14% /
/dev/hd2           7.00      2.12   70%    68501    13% /usr
/dev/hd9var        2.00      0.00  100%     9036    56% /var
/dev/hd3           2.00      0.93   54%     1604     1% /tmp
/dev/hd1           2.00      2.00    1%      121     1% /home
/dev/hd11admin      0.12      0.12    1%        5     1% /admin
/proc                 -         -    -         -     -  /proc
/dev/hd10opt       0.44      0.19   57%     9083    17% /opt
/dev/livedump      0.25      0.25    1%        4     1% /var/adm/ras/livedump
/dev/PAF_DVEBMGS00lv     15.00     10.80   28%    17249     1% /usr/sap/PAF/DVEBMGS00
/dev/PAFmntlv     10.00      6.24   38%   117725     8% /export/sapmnt/PAF
/dev/PAFtranslv     20.00     19.02    5%     1964     1% /export/usr/sap/trans
/dev/PAFascslv      5.00      4.71    6%      142     1% /usr/sap/PAF/ASCS10
KPAF:/export/sapmnt/PAF     10.00      6.24   38%   117725     8% /sapmnt/PAF
KPAF:/export/usr/sap/trans     20.00     19.02    5%     1964     1% /usr/sap/trans
# chfs -a size=+1G /
Filesystem size changed to 14680064
# chfs -a size=+1G /var
Filesystem size changed to 6291456
# df -g
Filesystem    GB blocks      Free %Used    Iused %Iused Mounted on
/dev/hd4           7.00      1.29   82%    11260     4% /
/dev/hd2           7.00      2.12   70%    68501    13% /usr
/dev/hd9var        3.00      1.00   67%     9036     4% /var
/dev/hd3           2.00      0.93   54%     1604     1% /tmp
/dev/hd1           2.00      2.00    1%      121     1% /home
/dev/hd11admin      0.12      0.12    1%        5     1% /admin
/proc                 -         -    -         -     -  /proc
/dev/hd10opt       0.44      0.19   57%     9083    17% /opt
/dev/livedump      0.25      0.25    1%        4     1% /var/adm/ras/livedump
/dev/PAF_DVEBMGS00lv     15.00     10.80   28%    17249     1% /usr/sap/PAF/DVEBMGS00
/dev/PAFmntlv     10.00      6.24   38%   117725     8% /export/sapmnt/PAF
/dev/PAFtranslv     20.00     19.02    5%     1964     1% /export/usr/sap/trans
/dev/PAFascslv      5.00      4.71    6%      142     1% /usr/sap/PAF/ASCS10
KPAF:/export/sapmnt/PAF     10.00      6.24   38%   117725     8% /sapmnt/PAF
KPAF:/export/usr/sap/trans     20.00     19.02    5%     1964     1% /usr/sap/trans
# 

之后我在A机上测试smitty hacmp>>View Current State。
没多久就发现B机宕机了。
还不能确认宕机与A机上测试smitty hacmp>>View Current State的时间关系。

收起
零售/批发 · 2017-06-15
浏览6788
hanqlhanql系统架构师IBM
可能和smitty hacmp>>View Current State的有关。见过用EMC的盘nmon宕机的。显示全部

可能和smitty hacmp>>View Current State的有关。
见过用EMC的盘nmon宕机的。

收起
互联网服务 · 2017-07-24
浏览5060

提问者

gemini8505
系统工程师KOLUMB
擅长领域: 服务器系统管理AIX

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-06-15
  • 关注会员:5 人
  • 问题浏览:12523
  • 最近回答:2017-07-24
  • X社区推广