AIX非计算内存最大值设置过大导致Oracle有些不能连接上

错误描述:AIX系统、Oracle数据库以及其监听器都没有做任何的修改,发现连接远程的数据库,有时可以连接上,有时连接不上数据库。1、连接不上数据库时:回报ORA-12537:TNS连接己关闭2、发现alert_SID.log没有发现错误 3、查看$ORACLE_HOME/network/log/listener.log日志错误如下:&n...显示全部
错误描述:

AIX系统、Oracle数据库以及其监听器都没有做任何的修改,发现连接远程的数据库,有时可以连接上,有时连接不上数据库。

1、连接不上数据库时:回报ORA-12537:TNS连接己关闭

2、发现alert_SID.log没有发现错误

3、查看$ORACLE_HOME/network/log/listener.log日志错误如下:

  25-MAY-2010 18:54:26 * (CONNECT_DATA=(SERVICE_NAME=testoms)(CID=(PROGRAM=D:项目资料plsqldevplsqldev.exe)(HOST=89587D60816246E)(USER=Administrator))) * (ADDRESS=(PROTOCOL=tcp)(HOST=10.88.22.77)(PORT=4954)) * establish * testoms * 12518

TNS-12518: TNS:listener could not hand off client connection

TNS-12547: TNS:lost contact

TNS-12560: TNS:protocol adapter error

  TNS-00517: Lost contact

   IBM/AIX RISC System/6000 Error: 32: Broken pipe



原因分析:

连接数据库,有时可以连接,有时连接不上。

用ping数据库ip -t  发现网络很稳定



一般出现上面的ora-12537错误,一般是因为数据库的listener.ora文件没有配置好,导致这样的错误。但没有改变过该文件,原来连接数据库一直很正常,突然发现有时能连接有时不能连接的现象。

用lsnrct status查看该监听正常。



该库为测试库,尝试了关闭数据库,再启动

>shutdown immediate  关闭正常

但启动时出现下面的错误

SQL> startup

Could not load program oracletestoms:

Could not load module /usr/lib/libperfstat.a(shr_64.o).

       Dependent module liblvm.a(shr_64.o) could not be loaded.

Could not load module liblvm.a(shr_64.o).

System error: Not enough space

Could not load module oracle.

       Dependent module /usr/lib/libperfstat.a(shr_64.o) could not be loaded.

Could not load module .

ORA-12547: TNS:lost contact

再次启动的错误又不一样:

SQL> startup

ORA-00443: background process "MMAN" did not start



感到这是AIX系统出现的问题,查看下交换空间

omstestdb:/> lsps -a

Page Space     Physical Volume  Volume Group   Size %Used Active Auto Type

Could not load program /usr/bin/sed:

       Dependent module libc.a(shr.o) could not be loaded.

Could not load module libc.a(shr.o).

Could not load program /usr/bin/awk:

       Dependent module libc.a(shr.o) could not be loaded.

Could not load module libc.a(shr.o).

0517-041 lsps: Cannot list paging space .



提示不能列出交换空间的大小,从这可以知道这是由于AIX的内存耗尽。

用topas查看目前的AIX查看内存及其交换空间的使用情况。

AIX的comp(计算内存)使用了4 GB,而nocomp(非计算内存)也使用了4GB,而交换空间则有很多的空闲。系统总共8GB的内存,而oracle中内存一般使用comp内存。而oracle的缓存则使用nocomp,有很多sql语句一直没有释放,使用了4GB的内存,而AIXnocomp的最大值也为4GB,导致内存不足。



限制AIX的nocomp(非计算)内存最大值。

把AIX的

minperm% = 20

maxclient% = 80

maxperm% = 80



调整更低。



解决步骤:

查看原来的AIX的minperm%、maxclient%、maxperm%的值。如下:

Root用户查看:

>vmo –a



minperm% = 20

maxclient% = 80

maxperm% = 80



把minperm%设置成10,maxclient%设置成20,maxperm%设置成20



用root命令行执行:

1、

vmo -p -o minperm%=10

2、

vmo -p -o maxclient%=20

3、

vmo -p -o maxperm%=20



执行上面的操作,AIX的nocomp还不能释放内存,重启了AIX系统

# reboot

重启之后,重启oracle以及监听器

SQL>startup



$lsnrctl start



启动数据库及其监听器均正常,连接数据库则正常。



备注:



minperm 和 maxperm 参数的值

操作系统通过把在曾经读写的内存页留在实内存一满足不同要求。如果文件页面在它们的页帧被重新分配前被请求,那就节省了输入输出操作。该文件页面可以来自本地的或远程的(如 NFS)系统。

页帧使用的文件相对用于计算的(工作或程序文本)段的文件的比例是松散地受控于 minperm 和 maxperm 的值的:

如果 RAM 中文件页面所占的百分比高于 maxperm,页面替换的窃取只用于文件页。

如果 RAM 中文件页面所占的百分比低于 minperm,页面替换的窃取同时用于文件页和计算页。

如果 RAM 中文件页面所占的百分比介于 minperm 和 maxperm之间,页面替换只窃取文件页,除非文件页的重调入数量大于计算页数。

其中Noncomp在20%-80%之间,此时内存页交换算法通常只交换文件缓存页,但如果文件缓存页的交换率大于程序页时,程序页也同样被交换。由于SGA属于Comp页,数据文件缓存属于Noncomp页,而在数据大量访问时,文件缓存页的交换率大于程序页(SGA),因此大量的SGA页面被交换;为避免大量SGA页被交换,需要降低maxperm%值到35%以下,这样就只有文件缓存页面被交换,减少了SGA交换的次数。收起
参与4

查看其它 2 个回答wuqun的回答

wuqunwuqun软件开发工程师yzw
不错,强顶了
互联网服务 · 2012-03-01
浏览2186

回答者

wuqun
软件开发工程师yzw
擅长领域: 服务器Linux关系型数据库

wuqun 最近回答过的问题

回答状态

  • 发布时间:2012-03-01
  • 关注会员:1 人
  • 回答浏览:2186
  • X社区推广