Oracle RAC系统内存无法释放解决

朴俊的oracle 2016-08-22

交代一下环境,是现网实时生产数据库主机。Hp-ux 11.31+Oracle 10.2.0.4.0 RAC集群。
两台机器户外RAC,essdb3与essdb4两台机器。
物理内存128G,SGA分配64G,PGA分配5G。早上发现essdb4主机glance运行只有6G的空闲内存。
使用如下命令进行简单分析:

SQL> select distinct sid from v$mystat;  得到sid,算算一个空闲进程占用的pga有多大。
SQL>select b.PGA_USED_MEM PGA_USED_MEM, b.PGA_ALLOC_MEM PGA_ALLOC_MEM,b.PGA_FREEABLE_MEM PGA_FREEABLE_MEM,b.PGA_MAX_MEM PGA_MAX_MEM from v$session a, v$process b where a.PADDR=b.ADDR and a.sid ='&sid'
输入刚刚得到的SID号。算出一个空闲进程大概占用的内存,系统总的PGA的使用基本上稳定在1.29G到2G之间(系统设置的PGA的最大值是5G),与往常相比也是一个非常合理的状态。

 SQL>  select sum(PGA_USED_MEM) from v$process;

SUM(PGA_USED_MEM)
-----------------
      1298679359

我们使用ipcs观察共享内存段的使用情况:

essdb4_oracle[/var/adm/syslog]$ipcs -mb
IPC status from /dev/kmem as of Thu Jun 23 10:18:00 2016
T        ID    KEY        MODE        OWNER    GROUP      SEGSZ
Shared Memory:
m          0 0x411c06cb --rw-rw-rw-      root      root        348
m          1 0x4e0c0002 --rw-rw-rw-      root      root      61760
m          2 0x4120077b --rw-rw-rw-      root      root      8192
m          3 0x00a5c581 --rw-------    sfmdb    users  10469376
m          4 0x411c14fb --rw-------      root      root      4096
m  13893637 0x00000000 --rw-r-----    oracle  oinstall 18790481920
m          6 0x06347849 --rw-rw-rw-      root      root      65544
m          7 0x0c6629c9 --rw-r-----      root      root  22614264
m      32776 0x01205c0a --rw-rw-r--      root      root      4192
m          9 0x00000000 D-rw-rw-r--      root      root      4192
m        10 0x00000000 D-rw-rw-r--      root      root      4192
m        11 0x4918a061 --rw-r--r--      root      root      22912
m        12 0x0120468b --rw-rw-r--      root      root      4192
m        13 0x00000000 --rw-r-----    oracle  oinstall 18807521280
m        14 0x00000000 --rw-r-----    oracle  oinstall 18807259136
m        15 0x00000000 --rw-r-----    oracle  oinstall 12367142912
m        16 0x3546761c --rw-r-----    oracle  oinstall    135168
共享内存的详细使用信息:
essdb4_oracle[/]#ipcs -mb
IPC status from /dev/kmem as of Thu Jun 23 13:42:57 2016
T        ID    KEY        MODE        OWNER    GROUP      SEGSZ
Shared Memory:
m          0 0x411c06cb --rw-rw-rw-      root      root        348
m          1 0x4e0c0002 --rw-rw-rw-      root      root      61760
m          2 0x4120077b --rw-rw-rw-      root      root      8192
m          3 0x00a5c581 --rw-------    sfmdb    users  10469376
m          4 0x411c14fb --rw-------      root      root      4096
m  13893637 0x00000000 D-rw-r-----    oracle  oinstall 18790481920
m          6 0x06347849 --rw-rw-rw-      root      root      65544
m          7 0x0c6629c9 --rw-r-----      root      root  22614264
m      32776 0x01205c0a --rw-rw-r--      root      root      4192
m          9 0x00000000 D-rw-rw-r--      root      root      4192
m        10 0x00000000 D-rw-rw-r--      root      root      4192
m        11 0x4918a061 --rw-r--r--      root      root      22912
m        12 0x0120468b --rw-rw-r--      root      root      4192
m        13 0x00000000 --rw-r-----    oracle  oinstall 18807521280
m        14 0x00000000 --rw-r-----    oracle  oinstall 18807259136
m        15 0x00000000 --rw-r-----    oracle  oinstall 12367142912
m        16 0x3546761c --rw-r-----    oracle  oinstall    135168

共享内存段状态为D - Delete,这在通常情况下是不正常的,这是一个Oracle用户占用的共享内存段,由于状态为D的共享内存段本身就是没有正常使用的内存段,所以满以为使用ipcrm –m id删除这个共享内存段,应该就可以解决问题,但是,当时上述做法的结果是系统报告找不到找个ID。
essdb4_oracle[/]#ipcrm -m 13893637
现在我们使用shminfo要使用root权限,查看一下当前到底哪个进程在使用找个共享内存段:
essdb4_oracle[/]#shminfo -s 13893637
sh: shminfo:  not found.
最后重启该节点数据库依然持有该共享内存,无果最后只能重启操作系统,得到释放,当前系统可用内存40G。

相关推荐