Linux vmstat 详解-yangemil-ChinaUnix博客

烟雨5月yangemil.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yangemil

博客访问： 288381
博文数量： 58
博客积分： 2317
博客等级：大尉
技术积分： 1080
用户组：普通用户
注册时间： 2005-12-22 13:16

文章分类

全部博文（58）

QTP（2）

学习脚本（0）
Win7（1）
Mysql（0）
oracle（16）
Loadrunner（4）
Linux（15）
中间件（4）
js&java（1）
DB2（0）
未分配的博文（15）

文章存档

2015年（1）

2014年（3）

2013年（4）

2012年（44）

2011年（6）

我的朋友

相关博文

Linux vmstat 详解

分类： LINUX

2012-06-13 10:40:28

linux的vmstat命令详解

vmstat结果内容的解释

Vmstat

procs -----------memory----------       ---swap--   -----io----       --system--   -----cpu------
        r b   swpd   free    buff       cache   si   so      bi    bo         in   cs          us sy id wa st
        2 0   88   199564 134860 1175252   0    0        0   352        9323 10496     8 6   85 0 0

procs
r 列表示运行和等待cpu时间片的进程数，如果长期大于1，说明cpu不足，需要增加cpu。
b 列表示在等待资源的进程数，比如正在等待I/O、或者内存交换等。

memory
swpd 切换到内存交换区的内存数量(k表示)。如果swpd的值不为0，或者比较大，比如超过了100m，只要si、so的值长期为0，系统性能还是正常
free 当前的空闲页面列表中内存数量(k表示)
buff 作为buffer cache的内存数量，一般对块设备的读写才需要缓冲。
cache: 作为page cache的内存数量，一般作为文件系统的cache，如果cache较大，说明用到cache的文件较多，如果此时IO中bi比较小，说明文件系统效率比较好。

swap
si 由内存进入内存交换区数量。
so由内存交换区进入内存数量。

IO
bi 从块设备读入数据的总量（读磁盘）（每秒kb）。
bo 块设备写入数据的总量（写磁盘）（每秒kb）
这里我们设置的bi+bo参考值为1000，如果超过1000，而且wa值较大应该考虑均衡磁盘负载，可以结合iostat输出来分析。

system 显示采集间隔内发生的中断数
in 列表示在某一时间间隔中观测到的每秒设备中断数。
cs列表示每秒产生的上下文切换次数，如当 cs 比磁盘 I/O 和网络信息包速率高得多，都应进行进一步调查。

cpu 表示cpu的使用状态
us 列显示了用户方式下所花费 CPU 时间的百分比。us的值比较高时，说明用户进程消耗的cpu时间多，但是如果长期大于50%，需要考虑优化用户的程序。
sy 列显示了内核进程所花费的cpu时间的百分比。这里us + sy的参考值为80%，如果us+sy 大于 80%说明可能存在CPU不足。
wa 列显示了IO等待所占用的CPU时间的百分比。这里wa的参考值为30%，如果wa超过30%，说明IO等待严重，这可能是磁盘大量随机访问造成的，也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。
id 列显示了cpu处在空闲状态的时间百分比

　vmstat命令输出分成六个部分：
　　(1)进程procs：
　　r：在运行队列中等待的进程数。
　　b：在等待io的进程数。
　　(2)内存memoy：
　　swpd：现时可用的交换内存（单位KB）。
　　free：空闲的内存（单位KB）。
　　buff: 缓冲去中的内存数（单位：KB）。
　　cache：被用来做为高速缓存的内存数（单位：KB）。
　　（3） swap交换页面
　　si: 从磁盘交换到内存的交换页数量，单位：KB/秒。
　　so: 从内存交换到磁盘的交换页数量，单位：KB/秒。
　　(4) io块设备:
　　bi: 发送到块设备的块数，单位：块/秒。
　　bo: 从块设备接收到的块数，单位：块/秒。
　　(5)system系统：
　　in: 每秒的中断数，包括时钟中断。
　　cs: 每秒的环境（上下文）切换次数。
　　（6）cpu中央处理器：
　　cs：用户进程使用的时间。以百分比表示。
　　sy：系统进程使用的时间。以百分比表示。
　　id：中央处理器的空闲时间。以百分比表示。

　　如果 r经常大于 4 ，且id经常小于40，表示中央处理器的负荷很重。

。

vmstat输出时间标示.

vmstat 1 1 | awk '{print system("date +%H:%M:%S"),$0}'

vmstat:报告关于内核进程,虚拟内存,磁盘,cpu的的活动状态的工具
主要有几个用法:
1.vmstat 间隔测试数量
输出如下
kthr memory page faults cpu
----- ----------- ------------------------ ------------ -----------
r b avm fre re pi po fr sr cy in sy cs us sy id wa
0 0 26258 18280 0 0 0 7 20 0 127 227 64 1 2 96 1

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
r b swpd free buff cache si so bi bo in cs us sy id wa st

4 0     88 336220 255096 934424       0    0     0     0      11415 15111      10 9 82 0 0
       4 0     88 336344 255096 934424       0    0     0    12     12621 17560      11 10 79 0 0
       3 0     88 336220 255100 934460       0    0     0   268    12245 16786      12 10 78 0 0
其中:
    kthr--内核进程的状态
--r 运行队列中的进程数,在一个稳定的工作量下,应该少于5 （r <5）
--b 等待队列中的进程数(等待I/O),通常情况下是接近0的. （b=0）

memory--虚拟和真实内存的使用信息
--avm 活动虚拟页面,在进程运行中分配到工作段的页面空间数.
--fre 空闲列表的数量.一般不少于120,当fre少于120时,系统开始自动的kill进程去释放

free list
page--页面活动的信息
--re 页面i/o的列表
--pi 从页面输入的页（一般不大于5)
--po 输出到页面的页
--fr 空闲的页面数(可替换的页面数)
--sr 通过页面置换算法搜索到的页面数
--cy 页面置换算法的时钟频率

faults--在取样间隔中的陷阱及中断数
--in 设备中断
--sy 系统调用中断
--cs 内核进程前后交换中断

cpu--cpu的使用率
--us 用户进程的时间
--sy 系统进程的时间
--id cpu空闲的时间
--wa 等待i/o的时间

一般us+sy 在单用户系统中不大于90,在多用户系统中不大于80.
wa时间一般不大于40.

r 表示运行队列(就是说多少个进程真的分配到CPU)，我测试的服务器目前CPU比较空闲，没什么程序在跑，当这个值超过了CPU数目，就会出现CPU瓶颈了。这个也和top的负载有关系，一般负载超过了3就比较高，超过了5就高，超过了10就不正常了，服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高。

b 表示阻塞的进程,这个不多说，进程阻塞，大家懂的。

swpd 虚拟内存已使用的大小，如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。

free 空闲的物理内存的大小，我的机器内存总共8G，剩余3415M。

buff Linux/Unix系统是用来存储，目录里面有什么内容，权限等的缓存，我本机大概占用300多M

cache cache直接用来记忆我们打开的文件,给文件做缓冲，我本机大概占用300多M(这里是Linux/Unix的聪明之处，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用。)

si 每秒从磁盘读入虚拟内存的大小，如果这个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。我的机器内存充裕，一切正常。

so 每秒虚拟内存写入磁盘的大小，如果这个值大于0，同上。

bi 块设备每秒接收的块数量，这里的块设备是指系统上所有的磁盘和其他块设备，默认块大小是1024byte，我本机上没什么IO操作，所以一直是0，但是我曾在处理拷贝大量数据(2-3T)的机器上看过可以达到140000/s，磁盘写入速度差不多140M每秒

bo 块设备每秒发送的块数量，例如我们读取文件，bo就要大于0。bi和bo一般都要接近0，不然就是IO过于频繁，需要调整。

in 每秒CPU的中断次数，包括时间中断

cs 每秒上下文切换次数，例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源，也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换，导致CPU干正经事的时间少了，CPU没有充分利用，是不可取的。

us 用户CPU时间，我曾经在一个做加密解密很频繁的服务器上，可以看到us接近100,r运行队列达到80(机器在做压力测试，性能表现不佳)。

sy 系统CPU时间，如果太高，表示系统调用时间长，例如是IO操作频繁。

id 空闲 CPU时间，一般来说，id + us + sy = 100,一般我认为id是空闲CPU使用率，us是用户CPU使用率，sy是系统CPU使用率。

wt 等待IO CPU时间。

阅读(930) | 评论(0) | 转发(0) |

上一篇：清除 oracle 缓存

下一篇：linux下测试磁盘的读写IO速度

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6