cluster.log日志过大

巡检的时候发现var系统文件使用率达到89%,查看发现是var/hamcp/adm/cluster.log日志文件过大,一般这个日志什么怎样产生的呢,如果要处理一般是怎么处理?显示全部
巡检的时候发现var系统文件使用率达到89%,查看发现是var/hamcp/adm/cluster.log日志文件过大,一般这个日志什么怎样产生的呢,如果要处理一般是怎么处理?收起
参与10

查看其它 8 个回答hufeng719的回答

hufeng719hufeng719联盟成员系统工程师某钢铁企业
var/hamcp/adm/cluster.log日志文件是一个主要的 HACMP log 文件 ,有关HACMP的错误信息及相关事件的信息按照它们发生的日期和时间顺序记录在这个 log 文件中 。由HA 的守护进程所产生。一般情况下主要记录相关群集事件发生时产生的一些信息。自定义对运行时可能发生的各种事情的响应可提高集群可用性。Event Manager 与 Cluster Manager 进行通信,负责触发和监视所有集群事件。
集群事件位于 /usr/es/sbin/cluster/events 中,可以划分为两类,如下面的屏幕中所示。
主要事件
这些事件由 Cluster Manager 调用。此类事件包括:
node_up 和 node_up_complete
node_down 和 node_down_complete
network_up 和 network_up_complete
network_down 和 network_down_complete
swap_adapter 和 swap_adapter_complete
fail_standby 和 join_standby
reconfig_topology_start 和 reconfig_topology_complete、reconfig_resource_acquire、reconfig_resource_complete 以及 reconfig_resource_release
event error 和 config_too_long

这些都是hacmp内部自动发生的的event,一般没必要深究。只要不影响使用不用管它。

另外,你如果想知道到底发生了什么,可以把日志中的内容粘出来一部分大家分析分析。我们的环境中也会出现你说的情况:大体内容是:
Oct 23 07:15:19 ap01 daemon:err|error syslog: slp: [5898424] decode_srvreg -- __srv_reg_local failed with rc = -2.
Oct 23 07:15:19 ap01 daemon:err|error syslog: slp: 0660-084 [5898424] The SA failed to decode and compute received message: Parse Error (-2).
Oct 23 08:15:19 ap01 daemon:err|error syslog: slp: 0660-065 [5898424] Impossible to parse attribute (ca-uid=file:///var/opt/tivoli/ep/runtime/agent),(am-host=),(ca-ips=192.168.10.12\2c 192.168.10.2\2c 172.16.12.11\2c 172.16.11.11),(ca-basic-port=9510),(ca-cert-port=9510),(ca-version=1.4.2.32),(os-uid=613CC74419AF11E19A6D000000000000).
Oct 23 08:15:19 ap01 daemon:err|error syslog: slp: [5898424] decode_srvreg -- __srv_reg_local failed with rc = -2.
Oct 23 08:15:19 ap01 daemon:err|error syslog: slp: 0660-084 [5898424] The SA failed to decode and compute received message: Parse Error (-2).
Oct 23 09:15:19 ap01 daemon:err|error syslog: slp: 0660-065 [5898424] Impossible to parse attribute (ca-uid=file:///var/opt/tivoli/ep/runtime/agent),(am-host=),(ca-ips=192.168.10.12\2c 192.168.10.2\2c 172.16.12.11\2c 172.16.11.11),(ca-basic-port=9510),(ca-cert-port=9510),(ca-version=1.4.2.32),(os-uid=613CC74419AF11E19A6D000000000000).
Oct 23 09:15:19 ap01 daemon:err|error syslog: slp: [5898424] decode_srvreg -- __srv_reg_local failed with rc = -2.
每隔一小时产生一次相关记录,至今没搞懂哪里出错了,lslpp -l |grep -i tivoli 查看了一下内容为:
Tivoli_Management_Agent.client.rte
  tivoli.tivguid             1.3.4.1  COMMITTED  IBM Tivoli GUID on AIX
  tivoli.tsm.StorageAgent    6.1.4.5  COMMITTED  TSM Storage Agent
  tivoli.tsm.client.api.32bit
  tivoli.tsm.client.api.64bit
  tivoli.tsm.client.ba.64bit.base
  tivoli.tsm.client.ba.64bit.common
  tivoli.tsm.client.ba.64bit.hdw
  tivoli.tsm.client.ba.64bit.image
  tivoli.tsm.client.ba.64bit.nas
  tivoli.tsm.client.ba.64bit.snphdw
  tivoli.tsm.client.ba.64bit.web
  Tivoli_Management_Agent.client.rte
  tivoli.tivguid             1.3.4.1  COMMITTED  IBM Tivoli GUID on AIX
不会是版本不一样引起的吧?求高手一起帮着看看。
能源采矿 · 2013-10-23
浏览3859

回答者

hufeng719
系统工程师某钢铁企业
擅长领域: 数据库存储服务器

hufeng719 最近回答过的问题

回答状态

  • 发布时间:2013-10-23
  • 关注会员:1 人
  • 回答浏览:3859
  • X社区推广