日常运维中,主要监控哪方面的告警?
收起资源池(主要指CPU)是为了动态调配资源。比如给LPAR一个保障(EC)=2C,最大可以超到5C(VP),那么主要监控的是
1)这5C是否满足这个业务峰值时的应用。如果不够,需要调整
2)CPU高峰的时候(比如已经用到4.5C),业务处理效率是否受影响,因为借来的CPU在性能上不能保证。如果影响比较大,可以调大EC或者关闭VP折叠,甚至不用资源池。
3)业务高峰的时候,看是否有业务积压且CPU不能接近5C。如果是这样,需要看看整个物理机的资源利用率是否紧张,已经LPAR的参数配置是否得当。当然原因可能有多方面,这么讲的是从资源的角度看。
告警方面,用日常的监控方式即可,没有特殊之处。