http://zlbzhu.blog.51cto.com/1413424/758973
Linux系统出现了性能问题,一般我们可以通过top、iostat、free、vmstat等命令 来查看初步定位问题。其中iostat可以给我们提供丰富的IO状态数据。
1. 基本使用
参数 -d 表示,显示设备(磁盘)使用状态;-k某些使用block为单位的列强制使用Kilobytes为单位;1 10表示,数据显示每隔1秒刷新一次,共显示10次。
tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。“一次传输”意思是“一次I/O请求”。多个逻辑请求可能会被合并为“一次I/O请求”。“一次传输”请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的数据量;kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;kB_read:读取的总数据量;kB_wrtn:写入 的总数量数据量;这些单位都为Kilobytes。
上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘总TPS是39.29,下面是各个分区的TPS。(因为是瞬间 值,所以总TPS并不严格等于各个分区TPS的总和)
2. -x 参数
使用-x参数我们可以获得更多统计信息。
rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的 时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);wrqm/s:每秒这个 设备相关的写入请求有多少被Merge了。
rsec/s:每秒读取的扇区数;wsec/: 每秒写入的扇区数。r/s:The number of read requests that were issued to the device per second;w/s:The number of write requests that were issued to the device per second;
await:每一个IO请求的处理的平均时间(单位是微秒)。这里可以理解为IO的响应时 间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
%util:在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该 设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因 为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
3. -c 参数
iostat还可以用来获取cpu部分状态值:
4. 常见用法
5. 实例分析
上面看到,磁盘每秒传输次数平均约400;每秒磁盘读取约5MB,写入约1MB。
可以看到磁盘的平均响应时间<5ms,磁盘使用率>80。磁盘响应正常,但是已经很繁忙了。
参考文献:
- Linux man iostat
- How Linux iostat computes its results
- Linux iostat
最近要对分布式集群做一些性能测试,其中一个很重要的项就是测试hadoop分布式集群在支持多磁盘轮转 写入的时候在各种磁盘配置的情况下的读写性能,如 在RAID0,RAID5和JBOD情况下的磁盘性能,所以linux 下的iostat命令就在产生report的脚本中非常有用,特此记录下iostat命令的一些使用笔 记 :
[命令:]iostat[-c|-d][-k][-t][间隔描述][检测次数]
参数:
-c:仅显示cpu的状态
-d:仅显示存储设备的状态,不可以和-c一起使用
-k:默认显示的是读入读出的block信息,用-k可以改成KB大小来显示
-t:显示日期
-pdevice|ALL:device为某个设备或者某个分区,如果使用ALL,就表示要显示所有分区和设备的信息
显示示例:
avg-cpu:%user%nice%sys%iowait%idle
4.550.000.630.2694.56
Device:tpskB_read/skB_wrtn/skB_readkB_wrtn
cciss/c0d030.1168.2067.1312327840601213452142
cciss/c0d0p10.000.000.0025312
cciss/c0d0p283.7868.1867.1112325720111213204536
dm-01.060.604.071087320173555720
dm-182.5067.4262.2312187043091124966656
dm-20.210.180.83319960514929540
dm-30.000.000.00372224
以上显示分为上下两个部分,上半部分显示CPU的信息,下面的数据显示存储设备的相关数据,它的数据意义如下:
tps:平均每秒钟的传送次数,与数据传输“次数”相关,非容量
kB_read/s:启动到现在的平均读取单位
kB_wrtn/s:启动到现在的平均写入单位
kB_read:启动到现在总共读出来的文件单位
kB_wrtn:启动到现在总共写入的文件单位
如果想要对iostat检查多此,每次之间的间隔一定数量的秒数,这样就可以查看每几秒钟之内的io统计数据,这对性能的测试才具有实际意义:
$>iostat-d23
表示没量秒钟检查一次,一共检查三次
avg-cpu:%user%nice%sys%iowait%idle
4.550.000.630.2694.56
Device:tpskB_read/skB_wrtn/skB_readkB_wrtn
cciss/c0d030.1168.2067.1312329002881213456210
cciss/c0d0p10.000.000.0025312
cciss/c0d0p283.7868.1967.1112326882391213208604
dm-01.060.604.071087320173558008
dm-182.5067.4262.2312188205371124967604
dm-20.210.180.83319960514930372
dm-30.000.000.00372224
avg-cpu:%user%nice%sys%iowait%idle
0.000.000.630.0099.37
Device:tpskB_read/skB_wrtn/skB_readkB_wrtn
cciss/c0d01.020.0063.270124
cciss/c0d0p10.000.000.0000
cciss/c0d0p215.820.0063.270124
dm-015.820.0063.270124
dm-10.000.000.0000
dm-20.000.000.0000
dm-30.000.000.0000
avg-cpu:%user%nice%sys%iowait%idle
0.000.000.320.0099.68
Device:tpskB_read/skB_wrtn/skB_readkB_wrtn
cciss/c0d03.060.0026.53052
cciss/c0d0p10.000.000.0000
cciss/c0d0p26.630.0026.53052
dm-00.000.000.0000
dm-16.630.0026.53052
dm-20.000.000.0000
dm-30.000.000.0000
其中每一次的统计都是上一次的统计时间到这次的统计时间之间的统计数据