DB2维护脚本
说明:所有的脚本都是基于DB2 UDB V8.2编写的,在AIX5.3的默认SHELL下运行,如果要移植到其他操作系统需要适当调整里面的语法。
我们使用的DB2服务器工作时段都非常繁忙,使用nmon监控服务器发现CPU使用率很高,有时候还连带出现持续很高的磁盘读取。这个时候,DB2服务器在执行一条写法有问题的SQL语句或者语句访问的表缺少合适的索引,或者页面程序控制的不好允许用户多次提交导致相同的SQL重复提到服务器去执行。无论哪种情况,都需要将出问题的进程找出来,看看到底在执行什么语句,执行了多长的时间,必要的时候还需要将个别进程中断。
这次脚本就是通过db2 list application show detail命令,结合使用awk命令,将状态”UOW Waiting“或者”Connect Completed“以外的进程,找出持续运行超过若干秒的进程的AGENTID,之后用db2 get snapshot for application agent AGENTID,抓进程的快照信息。
如果大家有更好的方法或者想法,请不吝赐教。
欢迎转发试用,转贴请注明出处。谢谢!
##############################################
#snap1.sh NN
#NN 即进程持续运行某句SQL语句的秒数
#snap1.sh 15 就是抓取持续运行15秒的进程的信息
. $HOME/sqllib/db2profile
export LANG=en_US
awkfile=$HOME/mon/snap1.awk
rand=$RANDOM
tempfile=$HOME/mon/snap1.temp.$rand
idfile=$HOME/mon/snap1.id.$rand
sqlfile=$HOME/mon/snap1.sql
cd ~/mon
db2 list application show detail | grep -ivE "^$|application name|handle|-------------------------" > $tempfile
cat $tempfile |awk -v wait=$1 -v HH="$(expr `date +%H`)" -v MM="$(expr `date +%M`)" -v SS="$(expr `date +%S`)" -f $awkfile > $idfile
cat $idfile | awk '{print "get snapshot for application agentid " $1 " ;"}' > $sqlfile
#awk '{print "get snapshot for application agentid " $1 " ;"}'
db2 -tvf $sqlfile
rm -fr $tempfile $idfile
##############################################
#snap1.awk
BEGIN {
facmd="" ;
# print wait,HH,MM,SS;
}
{
id=substr($0,53,6);
ip=substr($0,64,8);
status=substr($0,144,20);
date=substr($0,175,10);
hh=substr($0,186,2);
mm=substr($0,189,2);
ss=substr($0,192,2);
db=substr($0,202,8);
#print wait,id,ip,status,date,hh,mm,ss,db,HH,MM,SS;
ts=hh*3600 + mm*60 + ss;
TS=HH*3600 + MM*60 + SS;
dbpath=substr($0,212,4);
if (dbpath ~ /home/ && status !~ /UOW Waiting/ && status !~ /Connect Completed/)
{
ts=hh*3600 + mm*60 +ss;
TS=HH*3600 + MM*60 +SS;
if ( HH < hh )
{
TS=TS + 86400;
}
if ( TS - ts >= wait )
{
#print TS,ts,Ts-ts,wait,id,ip,status,date,hh,mm,ss,db,HH,MM,SS;
facmd=(facmd id "\n");
}
}
}
END {
printf("%s", facmd) ;
}
系统集成 · 2014-04-03