Linux的vmstat命令详解

linuxisperfect 2012-09-03

2011-01-1112:52linux的vmstat命令详解vmstat结果内容的解释

Vmstat

procs-----------memory-------------swap-------io------system-------cpu------

rbswpdfreebuffcachesisobiboincsussyidwast

20881995641348601175252000352932310496868500

procs

r列表示运行和等待cpu时间片的进程数,如果长期大于1,说明cpu不足,需要增加cpu。

b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。

memory

swpd切换到内存交换区的内存数量(k表示)。如果swpd的值不为0,或者比较大,比如超过了100m,只要si、so的值长期为0,系统性能还是正常

free当前的空闲页面列表中内存数量(k表示)

buff作为buffercache的内存数量,一般对块设备的读写才需要缓冲。

cache:作为pagecache的内存数量,一般作为文件系统的cache,如果cache较大,说明用到cache的文件较多,如果此时IO中bi比较小,说明文件系统效率比较好。

swap

si由内存进入内存交换区数量。

so由内存交换区进入内存数量。

IO

bi从块设备读入数据的总量(读磁盘)(每秒kb)。

bo块设备写入数据的总量(写磁盘)(每秒kb)

这里我们设置的bi+bo参考值为1000,如果超过1000,而且wa值较大应该考虑均衡磁盘负载,可以结合iostat输出来分析。

system显示采集间隔内发生的中断数

in列表示在某一时间间隔中观测到的每秒设备中断数。

cs列表示每秒产生的上下文切换次数,如当cs比磁盘I/O和网络信息包速率高得多,都应进行进一步调查。

cpu表示cpu的使用状态

us列显示了用户方式下所花费CPU时间的百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,需要考虑优化用户的程序。

sy列显示了内核进程所花费的cpu时间的百分比。这里us+sy的参考值为80%,如果us+sy大于80%说明可能存在CPU不足。

wa列显示了IO等待所占用的CPU时间的百分比。这里wa的参考值为30%,如果wa超过30%,说明IO等待严重,这可能是磁盘大量随机访问造成的,也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。

id列显示了cpu处在空闲状态的时间百分比

 vmstat命令输出分成六个部分:

(1)进程procs:

r:在运行队列中等待的进程数。

b:在等待io的进程数。

(2)内存memoy:

swpd:现时可用的交换内存(单位KB)。

free:空闲的内存(单位KB)。

buff:缓冲去中的内存数(单位:KB)。

cache:被用来做为高速缓存的内存数(单位:KB)。

(3)swap交换页面

si:从磁盘交换到内存的交换页数量,单位:KB/秒。

so:从内存交换到磁盘的交换页数量,单位:KB/秒。

(4)io块设备:

bi:发送到块设备的块数,单位:块/秒。

bo:从块设备接收到的块数,单位:块/秒。

(5)system系统:

in:每秒的中断数,包括时钟中断。

cs:每秒的环境(上下文)切换次数。

(6)cpu中央处理器:

cs:用户进程使用的时间。以百分比表示。

sy:系统进程使用的时间。以百分比表示。

id:中央处理器的空闲时间。以百分比表示。

如果r经常大于4,且id经常小于40,表示中央处理器的负荷很重。

如果bi,bo长期不等于0,表示物理内存容量太小。

vmstat输出时间标示.

vmstat11|awk'{printsystem("date+%H:%M:%S"),$0}'

vmstat:报告关于内核进程,虚拟内存,磁盘,cpu的的活动状态的工具

主要有几个用法:

1.vmstat间隔测试数量

输出如下

kthrmemorypagefaultscpu

---------------------------------------------------------------

rbavmfrerepipofrsrcyinsycsussyidwa

00262581828000072001272276412961

procs-----------memory-------------swap-------io------system-------cpu------

rbswpdfreebuffcachesisobiboincsussyidwast

4088336220255096934424000011415151111098200

408833634425509693442400012126211756011107900

3088336220255100934460000268122451678612107800

其中:

kthr--内核进程的状态

--r运行队列中的进程数,在一个稳定的工作量下,应该少于5(r<5)

--b等待队列中的进程数(等待I/O),通常情况下是接近0的.(b=0)

memory--虚拟和真实内存的使用信息

--avm活动虚拟页面,在进程运行中分配到工作段的页面空间数.

--fre空闲列表的数量.一般不少于120,当fre少于120时,系统开始自动的kill进程去释放

freelist

page--页面活动的信息

--re页面i/o的列表

--pi从页面输入的页(一般不大于5)

--po输出到页面的页

--fr空闲的页面数(可替换的页面数)

--sr通过页面置换算法搜索到的页面数

--cy页面置换算法的时钟频率

faults--在取样间隔中的陷阱及中断数

--in设备中断

--sy系统调用中断

--cs内核进程前后交换中断

cpu--cpu的使用率

--us用户进程的时间

--sy系统进程的时间

--idcpu空闲的时间

--wa等待i/o的时间

一般us+sy在单用户系统中不大于90,在多用户系统中不大于80.

wa时间一般不大于40.

2.vmstat-s

现实系统自初始化以来的页面信息.

top是给Linux设计的。在FreeBSDVM里面的Free概念和其他OS完全不同,使用top查看Free内存对于FreeBSD来说可以说没什么意义。正确的方法是看vmstat。

#vmstat

procsmemorypagediskfaultscpu

rbwavmfrefltrepipofrsrad0insycsussyid

021270512203163000026512231589985931199

最好使用vmstatt[n]命令,例如vmstat55,表示在T(5)秒时间内进行N(5)次采样。如果只使用vmstat,无法反映真正的系统情况。

procs:

r-->在运行的进程数

b-->在等待io的进程数(等待i/o,paging等等)

w-->可以进入运行队列但被替换的进程

memoy(以k为单位,包括虚拟内核和真实内存,正在运行或最近20秒在运行的进程所用的虚拟内存将被视为active)

avm-->活动的虚拟内存

free-->空闲的内存

pages(统计错误页和活动页,每5秒平均一下,以秒为单位给出数值)

flt-->错误页总数

re-->回收的页面

pi-->进入页面数

po-->出页面数

fr-->空余的页面数

sr-->每秒通过时钟算法扫描的页面

disk显示每秒的磁盘操作(磁盘名字的前两个字母加数字,默认只显示两个磁盘,如果有多的,可以加-n来增加数字或在命令行下把磁盘名都填上。)

fault显示每秒的中断数

in-->设备中断

sy-->系统中断

cy-->cpu交换

cpu表示cpu的使用状态

cs-->用户进程使用的时间

sy-->系统进程使用的时间

id-->cpu空闲的时间

解释:

如果r经常大于4,且id经常少于40,表示cpu的负荷很重。

如果pi,po长期不等于0,表示内存不足。

如果disk经常不等于0,且在b中的队列大于3,表示io性能不好。

Procs

r:等待运行的进程数b:处在非中断睡眠状态的进程数w:被交换出去的可运行的进程数。此数由linux计算得出,但linux并不耗尽交换空间

Memory

swpd:虚拟内存使用情况,单位:KB

free:空闲的内存,单位KB

buff:被用来做为缓存的内存数,单位:KB

Swap

si:从磁盘交换到内存的交换页数量,单位:KB/秒

s从内存交换到磁盘的交换页数量,单位:KB/秒

IO

bi:发送到块设备的块数,单位:块/秒

b从块设备接收到的块数,单位:块/秒

System

in:每秒的中断数,包括时钟中断

cs:每秒的环境(上下文)切换次数

CPU

按CPU的总使用百分比来显示

us:CPU使用时间

sy:CPU系统使用时间

id:闲置时间

准测

r<5,b≈0,

如果fre对于page列,re,pi,po,cy维持于比较稳定的状态,PI率不超过5,如果有pagin发生,那么关联页面必须先进行pageout在内存相对紧张的环境下pagein会强制对不同的页面进行steal操作。如果系统正在读一个大批的永久页面,你也许可以看到po和pi列会出现不一致的增长,这种情景并不一定表明系统负载过重,但是有必要对应用程序的数据访问模式进行见检查。在稳定的情况下,扫描率和重置率几乎相等,在多个进程处理使用不同的页面的情况下,页面会更加不稳定和杂乱,这时扫描率可能会比重置率高出。

faults列,in,sy,cs会不断跳跃,这里没有明确的限制,唯一的就是这些值最少大于100cpu列,us,sys,id和wa也是不确定的,最理想的状态是使cpu处于100%工作状态,单这只适合单用户的情况下。

如果在多用户环境中us+sys》80,进程就会在运行队列中花费等待时间,响应时间和吞吐量就会下降。wa>40表明磁盘io没有也许存在不合理的平衡,或者对磁盘操作比较频繁,vmstat各项:

procs:r-->在运行队列中等待的进程数b-->在等待io的进程数w-->可以进入运行队列但被替换的进程memoyswap-->现时可用的交换内存(k表示)free-->空闲的内存(k表示)pagesre--》回收的页面mf--》非严重错误的页面pi--》进入页面数(k表示)po--》出页面数(k表示)fr--》空余的页面数(k表示)de--》提前读入的页面中的未命中数sr--》通过时钟算法扫描的页面disk显示每秒的磁盘操作。s表示scsi盘,0表示盘号fault显示每秒的中断数in--》设备中断sy--》系统中断cy--》cpu交换cpu表示cpu的使用状态cs--》用户进程使用的时间sy--》系统进程使用的时间id--》cpu空闲的时间

如果r经常大于4,且id经常少于40,表示cpu的负荷很重。

如果pi,po长期不等于0,表示内存不足。

如果disk经常不等于0,且在b中的队列大于3,表示io性能不好。

Linux在具有高稳定性、可靠性的同时,具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整,优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进行系统调优时,了解系统性能分析工具是至关重要的。

在Linux下有很多系统性能分析工具,比较常见的有top、free、ps、time、timex、uptime等。下文将介绍几个较为重要的性能分析工具vmstat、iostat和sar及其使用。

用vmstat监视内存使用情况

vmstat是VirtualMeomoryStatistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、CPU活动进行监视。它是对系统的整体情况进行统计,不足之处是无法对某个进程进行深入分析。

vmstat的语法如下:

vmstat[-V][-n][delay[count]]

其中,-V表示打印出版本信息;-n表示在周期性循环输出时,输出的头部信息仅显示一次;delay是两次输出之间的延迟时间;count是指按照这个时间间隔统计的次数。对于vmstat输出各字段的含义,可运行manvmstat查看。

用iostat监视I/O子系统情况

iostat是I/Ostatistics(输入/输出统计)的缩写,iostat工具将对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况。同vmstat一样,iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。

iostat的语法如下:

iostat[-c|-d][-k][-t][-V][-x[device]][interval[count]]

其中,-c为汇报CPU的使用情况;-d为汇报磁盘的使用情况;-k表示每秒按kilobytes字节显示数据;-t为打印汇报的时间;-v表示打印出版本信息和用法;-xdevice指定要统计的设备名称,默认为所有的设备;interval指每次统计间隔的时间;count指按照这个时间间隔统计的次数。

iostat一般的输出格式如下:

Linux2.4.18-18smp(builder.linux.com)2003年03月07日

avg-cpu:%user%nice%sys%idle

4.810.011.0394.15

Device:tpsBlk_read/sBlk_wrtn/sBlk_readBlk_wrtn

dev3-030.311117.68846.521610453612197374

dev3-17.06229.6140.403308486582080

对于输出中各字段的含义,iostat的帮助中有详细的说明。

使用sar进行综合分析

表1sar参数说明

选项功能

-A汇总所有的报告

-a报告文件读写使用情况

-B报告附加的缓存的使用情况

-b报告缓存的使用情况

-c报告系统调用的使用情况

-d报告磁盘的使用情况

-g报告串口的使用情况

-h报告关于buffer使用的统计数据

-m报告IPC消息队列和信号量的使用情况

-n报告命名cache的使用情况

-p报告调页活动的使用情况

-q报告运行队列和交换队列的平均长度

-R报告进程的活动情况

-r报告没有使用的内存页面和硬盘块

-u报告CPU的利用率

-v报告进程、i节点、文件和锁表状态

-w报告系统交换活动状况

-y报告TTY设备活动状况

sar是SystemActivityReporter(系统活动情况报告)的缩写。顾名思义,sar工具将对系统当前的状态进行取样,然后通过计算数据和比例来表达系统的当前运行状态。它的特点是可以连续对系统取样,获得大量的取样数据;取样数据和分析的结果都可以存入文件,所需的负载很小。sar是目前Linux上最为全面的系统性能分析工具之一,可以从14个大方面对系统的活动进行报告,包括文件的读写情况、系统调用的使用情况、串口、CPU效率、内存使用状况、进程活动及IPC有关的活动等,使用也是较为复杂。

sar的语法如下:

sar[-option][-ofile]t[n]

它的含义是每隔t秒取样一次,共取样n次。其中-ofile表示取样结果将以二进制形式存入文件file中。

另一种语法如下:

sar[-option][-stime][-etime][-isec][-ffile]

含义是表示从file文件中取出数据,如果没有指定-ffile,则从标准数据文件/var/adm/sa/sadd取数据,其中dd表示当前天。另外,-stime表示起始时间;-etime表示停止时间;-isec表示取样的时间间隔,如果不指定则表示取文件中所有的数据。对于具体的选项参见表1。

一般它与-q和-u联合使用,以便对每个CPU的使用情况进行分析,比如运行如下命令:

sar-q-u51

将输出如下:

Linux2.4.18-18smp(builder.linux.com)2003年03月07日

09时46分16?CPU%user%nice%system%idle

09时46分21?all0.200.000.0099.80

09时46分16?runq-szplist-szldavg-1ldavg-5

09时46分21?0910.000.00

Average:CPU%user%nice%system%idle

Average:all0.200.000.0099.80

Average:runq-szplist-szldavg-1ldavg-5

Average:0910.000.00

由于sar命令太复杂,只有通过熟练使用才能了解每个选项的含义,对于sar输出中每个字段的含义运行mansar命令可以得到详细的解释。

相关推荐