起因:
一个客户近段时间一直让我检查他们Oracle Server
内存是否需要吃紧。
因为他一直使用linux 的Top
命令来看系统运行状况的。
下面我来写一下在linux OS
下如何判断系统是否内存吃紧。
我从两个部分来查看如何检查。
第一部分:查看内存使用状况
Linux 下使用Top
[root@itc-test9 ~]# top
top - 17:08:01 up 12 days, 3:48, 2 users, load average: 0.01, 0.01,
0.00
Tasks: 95 total, 1 running, 94
sleeping, 0
stopped, 0 zombie
Cpu(s): 0.0% us, 0.0% sy, 0.0% ni, 99.5% id, 0.5% wa, 0.0% hi, 0.0%
si
Mem: 2056000k
total, 1963652k
used, 92348k
free,
59156k buffers
Swap: 4096564k
total,
164k used, 4096400k free, 1605276k cached
PID
USER
PR NI VIRT RES SHR S %CPU
%MEM TIME+
COMMAND
1
root
16 0 4744 552 460 S 0.0
0.0 0:00.46 init
从Top 显示来看是有1963652K已经使用,只有92348k内存空闲。一直问我是否内存不足了。下面就来解释一下Oracle
在Linux 下如何查看OS 内存是否不足。
但我们从Linux command free
来看:
[oracle@itc-test9 ~]free
total
used
free
shared
buffers
cached
Mem:
2056000
1869596
186404
0
59172
1512236
-/+
buffers/cache:
298188 1757812
Swap:
4096564
164
4096400
-/+
buffers/cache:
used=298188k =291.2M
free=1757812k=1716.6M
约等于2G。
从Free 命令行来看OS 还有1.76G
空间未使用。
需要解释一下Free 和Top 在Linux
下的不同显示问题。
Free命令显示在操作系统中使用和空闲的内存数量。
Top 显示是和Linux 对内存使用的方式关系紧密,linux
尽可能的要求
使 用物理内存来提高Buffer 和Cache
对Disk 的I/O操作。Linux 将尽可能多的将I/O
操作磁盘上的信息保存在内存当中,如果Oracle(其他程序也一样)需要更多的内存空间,Linux 才会将一些内存使用LRU
算法清理出来,如果不需要则继续保持这些数据信息在内存中。所以我们使用Top看到的Memory FreeMem: 2056000k
total, 1963652k
used, 92348k
free很少。
第二部分:查看Swap
的状况:
Swap 空间的使用状况也能分辨出Oracle
服务器内存是否已经吃紧。
先看Swap 大小设定:
RAM Size Swap
Size
1-2G
1.5 倍 RAM
2-8G
1 倍 RAM
>8G
0.75 RAM
基本上每个操做系统(除Windows)都建议Swap
使用上面比例的配置。
但根据个人经验如果Server 的Memory
>32G 时,一般都会将Swap 空间设置在10g 以内,甚至更小。
使用Command more /proc/meminfo
或top 来Monitor Swap 的使用状况。
[root@itc-test9 ~]# more
/proc/meminfo
MemTotal:
2056000 kB
MemFree:
177268 kB
Buffers:
59292 kB
Cached:
1519188 kB
SwapCached:
4 kB
Active:
1092248 kB
Inactive:
654096 kB
HighTotal:
0 kB
HighFree:
0 kB
LowTotal:
2056000 kB
LowFree:
177268 kB
SwapTotal:
4096564 kB
SwapFree:
4096400 kB
[root@itc-test9 ~]# top
top - 17:08:01 up 12 days, 3:48, 2 users, load average: 0.01, 0.01,
0.00
Tasks: 95 total, 1 running, 94
sleeping, 0
stopped, 0 zombie
Cpu(s): 0.0% us, 0.0% sy, 0.0% ni, 99.5% id, 0.5% wa, 0.0% hi, 0.0%
si
Mem: 2056000k
total, 1963652k
used, 92348k
free,
59156k buffers
Swap: 4096564k
total,
164k used, 4096400k free, 1605276k cached
如果你观察Swap 中的使用量一直在增加,或Swap used
为一个很大的值。那我们基本就能确定在现有的状况下Oracle server
内存出现问题。(我们需要考虑此现象是偶尔发生还是一直出现)
我们需要做:
增加内存
减少OS
程序使用内存资源,如Oracle 减少SGA_target 或Memory_Target(11g)
增大交换空间
你可以通过vmstat 来看当前Swap
活动的状态。
Swap 下面的Si 和So 分别显示Swap
页面交换进来和交换出去。
[root@itc-test9 ~]# vmstat 3
8
procs -----------memory---------- ---swap-- -----io---- --system--
----cpu----
r b
swpd
free buff
cache
si
so
bi
bo
in cs us sy
id wa
0 0 164
175468 59292
1520344
0
0
1
21
4 20 0 0 99
0
0 0 164
175532 59292
1520344
0
0
0 48
1038 41 0 0
100 0
0 0 164
175532 59292
1520344
0
0
0 61
1032 35 0 0
99 0
0 0 164
175532 59292
1520344
0
0
0 11
1028 39 0 0
100 0
0 0 164
175532 59292
1520344
0
0
0 15
1024 39 0 0
100 0
使用Vmstat 命令只能看当前的Swap
页面的交换入和交换出。那如何看历史Swap 信息呢。
Linux 下有一个命令可以看,那就是
[root@itc-test9 sa]# cd
/var/log/sa
[root@itc-test9 sa]# ls -al |grep 13
drwxr-xr-x 2 root
root 4096 Apr 13 00:00 .
-rw-r--r-- 1 root root 209328
Apr 13 17:50 sa13
[root@itc-test9 sa]#
date
----今天是4/13 号
Mon Apr 13 17:58:02 CST
2009
[root@itc-test9 sa]# ll |grep 13
-rw-r--r-- 1 root root 209328 Apr 13 17:50 sa13
[root@itc-test9 sa]# sar -W -f
sa13
Linux 2.6.9-5.ELsmp
(itc-test9)
04/13/2009
12:00:01 AM pswpin/s
pswpout/s
12:10:01
AM
0.00
0.00
12:20:01
AM
0.00
0.00
12:30:01
AM
0.00
0.00
12:40:01
AM
0.00
0.00
12:50:01
AM
0.00
0.00
01:00:01
AM
0.00
0.00
01:10:01
AM
0.00
0.00
01:20:01
AM
0.00
0.00
......(中间略去)
......
(中间略去)
03:50:01
PM
0.00
0.00
04:00:01
PM
0.00
0.00
04:10:01
PM
0.00
0.00
04:20:01
PM
0.00
0.00
04:30:01
PM
0.00
0.00
04:40:01
PM
0.00
0.00
04:50:01
PM
0.00
0.00
05:00:01
PM
0.00
0.00
05:10:01
PM
0.00
0.00
05:20:01
PM
0.00
0.00
05:30:01
PM
0.00
0.00
05:40:01
PM
0.00
0.00
05:50:01
PM
0.00
0.00
Average:
0.00
0.00
显示从今天0点到当前的所有Swap
页面交换的数量