musicman 2014-11-17
squid缓存疑问问题归纳:
1squid缓存的数据,何时过期,如何判断缓存的数据已经过期,如何把最新的数据缓入squid并且替换掉旧的内容
2如何判断数据是否应该被缓存
3校验失败时,是否给出缓存中旧的内容
上面的几个问题都可以通过squid中的refresh_pattern配置项找到答案。
答案简单归纳如下
1何时过期要根据配置选项
squid配置项refresh_pattern[-i]regexminpercentmax[options]
这个配置项中min和max是针对请求停留在cache中的时间设置的,
min参数是分钟数量,它是过时响应的最低时间限制。
如果某个响应驻留在cache里的时间没有超过这个最低限制,
那么它不会过期。同样max参数是存活响应的最高时间限制。
如果某个响应驻留在cache里的时间高于这个最高限制,那么它必须被刷新
minmax并不是精确控制参数,如果需要精确控制可以使用percent
percent会计算得出一个时间以首页index.html为例,假设有效期为7分钟,
在3:00缓入squid,如果在这段有效期内,有改变则把最新的index.html返还给squid,
而squid收到会更新缓存,然后把新的index.html返还给客户端,
同时根据新页面中的Last_Modified和取页面的时间,重新计算resourceage,同样也重新计算存活时间
如果没有改变的话7分钟过后,首页过期,如果这段时间没有index.html的请求,
index.html会一直缓存中,如果有index.html请求,squid收到请求后,
由于已经过期,squid会像源服务器发一个index.html是否有改变的请求,
如果源服务器收到请求后,如果index.html没有更新,squid就不用缓存,
直接会把缓存中的内容给客户端;同时,重置对象进入cache的时间为源服务器确认的时间。
2一个object的header部分被squid得到之后,是要判断一下,这个object在过期校验层面上,
是否适合被缓存。如果不适合(要校验一个object主要有2种手段,If-Modified-Since和If-None-Match,
一个需要Last-Modified头,一个需要ETag头。这两个头如果都没有的话,object也是不能缓存的。),
将直接不缓存这个object。
如果过期时间大于配置文件中的minimum_expiry_time这个配置项则会缓存,否则不会缓存。
3检查当回源校验失败时,是否能将已经过期的object给出去。如果一次回源校验,
原站给出了一个5xx的话,squid为了能让客户端继续拿到内容,可能会将磁盘上的旧内容发给客户端,
但要有一定的条件,即检查object是否已经“严重过期”。
squid配置文件中有refresh_pattern配置项
refresh_pattern最主要的作用,过期校验
Squid的过期校验是访问驱动的,如果一个object过期了,却又一直没人访问,
那么squid会一直把这个object扔在那里,而不会主动地回源校验它。
只有当客户端访问到了这个object的时候,squid才会校验。
先介绍一下refresh_pattern的配置方法:
refresh_pattern[-i]regexminpercentmax[options]
-i表示正则匹配时不区分大小写-i选项是忽略大小写,
regex是与url进行匹配的正则表达式
min,percent,max是3个数字,min,max的单位是分钟,percent就是百分比。
min参数是分钟数量,它是过时响应的最低时间限制。
如果某个响应驻留在cache里的时间没有超过这个最低限制,
那么它不会过期。同样max参数是存活响应的最高时间限制。
如果某个响应驻留在cache里的时间高于这个最高限制,那么它必须被刷新
options是refresh_pattern的其他选项,包括以下几种
override-expire
override-lastmod
reload-into-ims
ignore-reload
ignore-no-cache
ignore-private
ignore-auth
stale-while-revalidate=NN
ignore-stale-while-revalidate
max-stale=NN
negative-ttl=NN
refresh_pattern算法解析如下
squid的refresh_pattern算法的简单描述
1如果响应年龄超过refresh_pattern的max值,该响应过期;
2如果LM-factor少于refresh_pattern的percent的值。该响应存活
3如果响应年龄少于refresh_pattern的min值,该响应存活
4其他情况,响应过期
Refresh_patternpercent计算方法
Resourceage=对象进入cache的时间–对象的last_modified
Responseage=当前时间–对象进入cache的时间
LM-factor=(responseage)/(resourceage)
Date一般是Squid从后面取页面的时间,Last-Modified一般是页面生成时间。
(当前时间定义为CURRENT_DATE)
1)If((CURRENT_DATE-DATE(就是LM里定义的时间))<min),cache是新鲜的
2)elseif((CURRENT_DATE-DATE)<(min+(max-min)*percent),cache是新鲜的
3)elsecache是过期的
如果希望页面一进入cache就不删除,直到被主动purge掉为止,可以加上ignore-reload选项
该项常用在mp3,wma,wmv,gif之类
一般情况可以使用reload-into-ims。
举例:
refresh_pattern-i\.gif$144050%2880ignore-reload
refresh_pattern-i\.jpg$144050%2880ignore-reload
refresh_pattern-i\.png$144050%2880ignore-reload
refresh_pattern-i\.mp3$144050%2880ignore-reload
refresh_pattern-i\.wmv$144050%2880ignore-reload
refresh_pattern-i\.rm$144050%2880ignore-reload
refresh_pattern-i\.swf$144050%2880ignore-reload
refresh_pattern-i\.mpeg$144050%2880ignore-reload
refresh_pattern-i\.wma$144050%2880ignore-reload
refresh_pattern-i\.css$1050%60reload-into-ims
refresh_pattern-i\.js$1050%60reload-into-ims
refresh_pattern-i\.xml$1050%30reload-into-ims
举个例子解析refresh_pattern的配置项
refresh_pattern20%
假如源服务器上www.aaa.com/index.html---lastmodified是2007-04-1002:00:00
Squid上的proxy.aaa.com/index.htmlindex.html存入cache的时间2007-04-1003:00:00
1如果当前时间2007-04-1003:00:00
Resourceage=3点–2点=60分钟
Responseage=0分钟
Index.html还可以在cache中停留的时间(resourceage)*20%=12分钟,换句话说,
index.html进入cache后,可以停留十二分钟,才被重新载入
2如果当前时间是2007-04-1003:05:00
Resourceage=3点–2点=60分钟
Responseage=5分钟
Index.html还可以在cache中停留的时间
(resourceage)*20%=12分钟-5=7分钟
LM-factor=5/60=8.3%<20%
3所有说2007-04-1003:12:00LM-factor=12/60=20%之后,
cache中的页面index.html终于stale,如果这段时间没有index.html的请求,
index.html会一直缓存中,如果有index.html请求,squid收到请求后,
由于已经过期,squid会像源服务器发一个index.html是否有改变的请求,
如果源服务器收到请求后,如果index.html没有更新,squid就不用缓存,
直接会把缓存中的内容给客户端;同时,重置对象进入cache的时间为源服务器确认的时间。
比如2007-04-1003:13:00,如果正好在这个后重新确认了页面。重置后,resourceage变长,
相应在cache中的cache中存活的时间也同样变长
如果有改变则把最新的index.html返还给squid,而squid收到会更新缓存,
然后把新的index.html返还给客户端,同时根据新页面中的Last_Modified和取页面的时间,
重新计算resourceage,同样也重新计算存活时间
实际上,一个对象进入cache后,同样他的存活时间就确定了,即(resourceage)*percent,
直到被重新确认