Memcached for移动互联网:mcperf压测1k~10k数据笔记

81991935 2012-12-31

移动互联网场景中随着人机交互方式的改变,用户数据也发生了比较大的改变。从以1k以下的文本为主数据,变为1k~10k的音频占很大比例的数据。响应的后端服务的队列、存储、缓存也需要做一系列针对性调整。这里就简单记录一下maoyidao对Memcached的压测情况。

1. 压测工具:mcperf

mcperf使用简单,输出报告清晰。最初是twitter为了证明其Twemcache在特定场景下(需要自动调节slab大小的场景下)比memcached强悍而开发的基准压测工具。比如在Random Eviciton vs Slab Automove(https://github.com/twitter/twemcache/wiki/Random-Eviciton-vs-Slab-Automove)一文中,就使用了mcperf作为基准压测工具。

1.1 安装

下载tar包,执行autoreconf

# git clone git://github.com/twitter/twemperf.git

#cdtwemperf

# autoreconf -fvi

 

我得到了一个错误,autoconf版本太低,需要升级。先看一下本机版本,然后下载安装2.65版本的autoconf。

# rpm -qf /usr/bin/autoconf

#wgethttp://ftp.gnu.org/gnu/autoconf/autoconf-2.65.tar.gz

#tar-xzvfautoconf-2.65.tar.gz

#cdautoconf-2.65

#./configure--prefix=/usr

#make

#makeinstall

# /usr/bin/autoconf -V

 

安装完毕,通过help命令看一下版本号。

# CFLAGS="-ggdb3 -O0" ./configure --enable-debug

#make

# src/mcperf -h

1.2 压测命令

src/mcperf -s 172.16.138.88 -p 11211 --linger=0 --timeout=5 --conn-rate=1000 --call-rate=1000 --num-calls=10000 --num-conns=100 --sizes=u1024,10240

--num-conns=100是并发建立100个连接;--num-calls=10000是在一个连接上发1w个请求;--sizes是数据大小在1k和10k之间称正态分布;-conn-rate=1000是1秒钟建立1000个连接

2. 压测环境

2.1 启动Memcached

/usr/local/bin/memcached -d -m 1024 -p 11211 -u root

查看一下Memcached设置,主要关注:growth_factor、maxconns和evictions:

[maoyidao@yf03701 ~]$ printf "stats settings\r\n" | nc 172.16.138.123 11212

STAT maxbytes 0

STAT maxconns 4096

STAT tcpport 11212

STAT udpport 11211

STAT inter 172.16.138.123

STAT verbosity 0

STAT oldest 0

STAT evictions on

STAT domain_socket NULL

STAT umask 700

STAT growth_factor 1.25

STAT chunk_size 48

STAT num_threads 5

STAT stat_key_prefix :

STAT detail_enabled no

STAT reqs_per_event 20

STAT cas_enabled yes

STAT tcp_backlog 1024

STAT binding_protocol auto-negotiate

END

2.2 Memcached性能监控

下面介绍2个广泛使用的Memcached性能监控工具,在MC的实际使用中起到极大作用,每个使用MC的同学都应该熟练掌握。

2.2.1 memcached-tool

主要用于查看slab分配的情况,evction的情况。

https://github.com/memcached/memcached/blob/master/scripts/memcached-tool

[root@yf08801 maoyidao]# ./memcache-tool localhost:11211

  #  Item_Size  Max_age   Pages   Count   Full?  Evicted Evict_Time OOM

 19     5.5K      2080s      63   11587     yes     1791      710    0

 20     6.9K      2080s     234   34388     yes     5143      710    0

 21     8.7K      2080s     365   43057     yes     6600      710    0

 22    10.8K      2080s     365   34294     yes     5501      710    0

2.2.2 memcache-top

主要用于查看吞吐和hits情况。

http://code.google.com/p/memcache-top/

./memcache-top-v0.6 --instance 172.16.138.123,172.16.138.124 --port 11211

memcache-top v0.6       (default port: 11211, color: on, refresh: 3 seconds)

INSTANCE                USAGE   HIT %   CONN    TIME    EVICT/s READ/s  WRITE/s

172.16.138.123:11411    13.4%   96.1%   871     671.8ms 0.0     16.9K   39.4K

172.16.138.124:11411    13.3%   96.1%   865     660.6ms 0.0     20.8K   49.7K

AVERAGE:                13.4%   96.1%   868     666.2ms 0.0     18.9K   44.6K

TOTAL:          0.5GB/  4.0GB           1736    1.33s   0.0     37.8K   89.1K

3. 压测结果

3.1 总结

1,即使对于5k~10k大数据,mc的吞吐和延时表现也令人感到满意。

2,连接数需要控制,100个并发连接的延时是1000个并发连接的1%,吞吐也高了3倍。

3,大量的eviction对mc本身影响不大,但在这个场景显然需要预热。因为大数据会迅速占据所有slab空间,导致后面的小数据无内存可分,如下面的统计:

[root@yf08801 maoyidao]# ./memcache-tool localhost:11211

  #  Item_Size  Max_age   Pages   Count   Full?  Evicted Evict_Time OOM

 12     1.2K      3043s       1     885     yes     7837        5    0

 13     1.4K      3047s       1     708     yes    31336        1    0

 14     1.8K      3047s       1     564     yes    40180        1    0

 15     2.3K      3047s       1     451     yes    49471        1    0

 16     2.8K      3048s       1     361     yes    63140        0    0

 17     3.5K      3048s       1     288     yes    78878        0    0

 18     4.4K      3048s       1     230     yes    98750        0    0

 19     5.5K      3043s      63   11592     yes   117272        5    0

 20     6.9K      3037s     234   34398     yes   131097       11    0

 21     8.7K      3037s     365   43070     yes   163339       11    0

 22    10.8K      3037s     365   34310     yes   132305       11    0

3.2 原始数据摘要

数据大小:5k~10k,set 10w次;

1000个连接:3436.0 rsp/s;Response time [ms]: avg 178.0 min 0.0 max 2244.1 stddev 0.22

100个连接:9909.9 req/s;Response time [ms]: avg 0.6 min 0.1 max 2.4 stddev 0.00

相关推荐