机械装备AIXhacmp

请教:app节点上的hacmp无法启动?

app节点的网卡的光纤跳线故障,更换后,启动app节点,然后app节点的hacmp服务无法启动。

这是什么原因?如何处理,求高手解答

Verifying Cluster Configuration Prior to Starting Cluster Services.

Verifying node(s): icdcapp against the running node icdcdb ERROR: IP Label icdcapp associated with IP address
'10.0.0.14' in the HACMP
configuration has conflicting IP Addresses specified in /etc/hosts file:
        Node icdcapp has IP Address '10.0.0.13'


WARNING: Network option "routerevalidate" is set to 0 on the following nodes:

        icdcapp
        
Starting Corrective Action: cl_resource_set_net_option.
<01> Successfully set network option routerevalidate="1" on node icdcapp

WARNING: Application monitors are required for detecting application failures
in order for HACMP to recover from them.  Application monitors are started
by HACMP when the resource group in which they participate is activated.
The following application(s), shown with their associated resource group,
do not have an application monitor configured:
Application Server                Resource Group
  --------------------------------  ---------------------------------
   db_svr                            db_rg
   app_svr                           app_rg
   
SUMMARY REPORT

Results of: /usr/es/sbin/cluster/diag/clver -f /tmp/autoverify/86394/verify.checks -S -r -t -w auto -C inter
active -G icdcapp

Node        Errors Logged

--------------------------------------------------
All          0
icdcapp      2
icdcdb       0
--------------------------------------------------
Totals       2

Cluster services will not start on node(s): icdcapp
Please see the above verification errors for more detail.
A trace of the verification warning/error messages above
is available in the file:
    /var/hacmp/clverify/clverify.log



查看cluster

# lssrc -g cluster
Subsystem         Group            PID          Status
clstrmgrES       cluster          103412       active
# ps -ef|grep cluster
    root 119016  95224   0 22:37:33  pts/0  0:00 grep cluster
    root  29652  57798   0 18:00:58      -  0:03 /usr/es/sbin/cluster/clcomd -d
    root 103412  57798   0 18:01:01      -  0:00 /usr/es/sbin/cluster/clstrmgr

# /usr/es/sbin/cluster/utilities/cldump

Obtaining information via SNMP from Node: icdcdb...

_____________________________________________________________________________
Cluster Name: icdc
Cluster State: UP
Cluster Substate: STABLE
_____________________________________________________________________________

Node Name: icdcapp              State: DOWN

  Network Name: net_ether_01       State: DOWN

    Address: 10.0.0.13       Label: icdcapp_boot       State: DOWN
    Address: 192.168.1.200   Label: icdcapp_stb        State: DOWN

  Network Name: net_rs232_02       State: DOWN


Node Name: icdcdb               State: UP

  Network Name: net_ether_01       State: UP

    Address: 10.0.0.11       Label: icdcdb_boot        State: DOWN
    Address: 10.0.0.12       Label: icdcdb             State: UP
    Address: 192.168.1.100   Label: icdcdb_stb         State: UP

  Network Name: net_rs232_02       State: DOWN



Cluster Name: icdc

Resource Group Name: db_rg
Startup Policy: Online On Home Node Only
Fallover Policy: Fallover To Next Priority Node In The List
Fallback Policy: Never Fallback
Site Policy: ignore
Node                         Group State      
---------------------------- ---------------
icdcdb                       ONLINE         
icdcapp                      OFFLINE         

Resource Group Name: app_rg
Startup Policy: Online On Home Node Only
Fallover Policy: Fallover To Next Priority Node In The List
Fallback Policy: Never Fallback
Site Policy: ignore
Node                         Group State      
---------------------------- ---------------
icdcapp                      OFFLINE         
icdcdb                       OFFLINE
参与12

12同行回答

午夜幽魂午夜幽魂系统运维工程师计算机有限公司
过来学习的,呵呵,了解了显示全部
过来学习的,呵呵,了解了收起
系统集成 · 2011-08-25
浏览2008
lizhibinglizhibing系统运维工程师建亿通(北京)数据处理信息有限公司
也可能是我不小心改的啊,没注意啊。    之前,换的一根光纤跳线,en2总显示是down的。这他妈的(什么狗屁永速的光纤跳线)新光纤跳线质量真差,连接后不通。又换了一根,en2亮了。...显示全部
也可能是我不小心改的啊,没注意啊。
    之前,换的一根光纤跳线,en2总显示是down的。这他妈的(什么狗屁永速的光纤跳线)新光纤跳线质量真差,连接后不通。又换了一根,en2亮了。收起
机械装备 · 2011-08-14
浏览2124
feidaodaofeidaodao系统运维工程师GA
/etc/hosts应该是人为修改过了显示全部
/etc/hosts应该是人为修改过了收起
金融其它 · 2011-08-13
浏览2486
lizhibinglizhibing系统运维工程师建亿通(北京)数据处理信息有限公司
已解决。有个问题不明白,icdcapp的/etc/hosts怎么会变了。解决步骤:1)检查icdcdb的/etc/hosts和icdcapp的/etc/hosts,发现icdcapp的hosts和icdcdb的hosts不一致,修改为和icdcdb的hosts一致。2)检查icdcdb和icdcapp的ip地址设置是否正确。ifconfig -a3)icdcapp上appvg在hacmp...显示全部
已解决。
有个问题不明白,icdcapp的/etc/hosts怎么会变了。
解决步骤:
1)检查icdcdb的/etc/hosts和icdcapp的/etc/hosts,发现icdcapp的hosts和icdcdb的hosts不一致,修改为和icdcdb的hosts一致。
2)检查icdcdb和icdcapp的ip地址设置是否正确。ifconfig -a
3)icdcapp上appvg在hacmp启动前,不应该varyon,请先varyoff这个vg,再启动ha.
        (appvg显示为varyon是我手动varyon的,不懂啊)
4)启动ha之前先从正在运行的节点icdcdb同步一下配置。
5)在icdcapp上启动ha.

看来实践很重要。收起
机械装备 · 2011-08-13
浏览2562
feidaodaofeidaodao系统运维工程师GA
/etc/hosts如下:127.0.0.1               loopback localhost      # loopback (lo0) name/addres ...lizhibing 发表于 2011-8-13 03:29 hacmp中icdcapp分配的是10.0.0.14而Node icdcapp has IP...显示全部
/etc/hosts如下:
127.0.0.1               loopback localhost      # loopback (lo0) name/addres ...
lizhibing 发表于 2011-8-13 03:29



hacmp中icdcapp分配的是10.0.0.14
而Node icdcapp has IP Address '10.0.0.13'   

把输出贴一下:
1:/usr/es/sbin/cluster/utilities/cltopinfo
2:2个节点的netstat -in
3:你对比一下2个节点/etc/hosts关于label为icdcapp的行。收起
金融其它 · 2011-08-13
浏览2462
feidaodaofeidaodao系统运维工程师GA
回复 5# lizhibing 表好意思,没认真看内容。请见谅。显示全部
回复 5# lizhibing


表好意思,没认真看内容。请见谅。收起
金融其它 · 2011-08-13
浏览2501
lizhibinglizhibing系统运维工程师建亿通(北京)数据处理信息有限公司
额,高人们都过来帮忙看啥错误啊显示全部
额,高人们都过来帮忙看啥错误啊收起
机械装备 · 2011-08-13
浏览2504
lizhibinglizhibing系统运维工程师建亿通(北京)数据处理信息有限公司
看报错信息:IP Label icdcapp associated with IP address'10.0.0.14' in the HACMP configuration has c ...czb1984 发表于 2011-8-13 02:01     /etc/hosts如下:127.0.0.1               loopback localh...显示全部
看报错信息:IP Label icdcapp associated with IP address
'10.0.0.14' in the HACMP configuration has c ...
czb1984 发表于 2011-8-13 02:01



    /etc/hosts如下:
127.0.0.1               loopback localhost      # loopback (lo0) name/address
#icdcdb node
10.0.0.12               icdcdb
10.0.0.11               icdcdb_boot
192.168.1.100           icdcdb_stb
#icdcapp node
10.0.0.14               icdcapp
192.168.1.200           icdcapp_stb
10.0.0.13       icdcapp_boot  icdcapp收起
机械装备 · 2011-08-13
浏览2630
lizhibinglizhibing系统运维工程师建亿通(北京)数据处理信息有限公司
回复 2# feidaodao 我没有更换app的hba卡。究竟是什么问题。显示全部
回复 2# feidaodao
我没有更换app的hba卡。究竟是什么问题。收起
机械装备 · 2011-08-13
浏览2503
czb1984czb1984项目经理浙江省公众信息产业有限公司
看报错信息:IP Label icdcapp associated with IP address'10.0.0.14' in the HACMP configuration has conflicting IP Addresses specified in /etc/hosts file: Node icdcapp has IP Address '10.0.0.13'IP标签有冲突的的IP地址,检查下/etc/hosts文件吧,看看是不是10.0.0...显示全部
看报错信息:IP Label icdcapp associated with IP address
'10.0.0.14' in the HACMP configuration has conflicting IP Addresses specified in /etc/hosts file:
Node icdcapp has IP Address '10.0.0.13'

IP标签有冲突的的IP地址,检查下/etc/hosts文件吧,看看是不是10.0.0.14和10.0.0.13配了相同的IP label收起
系统集成 · 2011-08-13
浏览2797

提问者

lizhibing
系统运维工程师建亿通(北京)数据处理信息有限公司
擅长领域: 云计算容器云容器

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-08-12
  • 关注会员:0 人
  • 问题浏览:15626
  • 最近回答:2011-08-25
  • X社区推广