关于浏览器缓存的控制cache-control,expires,last-modified,etag,及编程示例

xasdfg 2015-05-06

原理

       浏览器的缓存的意义在于减少网络流量,为了达到这个目的,采用了两个手段

 1、减少客户端对服务器的请求

       解决方案是:为每个资源设置一个有效期限。

       在客户端取得资源后,缓存在本地,一段时间内,如果再次展示这个资源时,不再向服务器发出请求,而是直接取缓存的内容。

       相对应的编程手段就是

          1. 在Htpp的Header中指定Cache-Control:max-age=xxx(秒)

          2. 或 Expires= Tue, 28 Apr 2015 15:50:47 GMT (这里必须是GMT时间)

        以上这两者都存在时,Cache-Control 优先。

 2、服务器不传输重复的内容

       解决方案是:服务器为每个资源打上一个标记(或时间戳)。

       这些标记会连同资源一起发送给客户端,客户端在请求时,如果缓存中已经有这个资源,就把这些标记发回给服务器,服务器根据这些标记判断是否重新发送。相对应的编程手段是

          A. Htpp的Header中指定Last-Modified / If-Modified-Since ,服务端发送资源是带上Last-Modified,客户端请求时带上If-Modified-Since,服务端判断到资源未变时,响应 304 状态码。这两个也都是GMT 时间格式

          B Htpp的Header中指定 ETag / If-None-Match ,服务端发送资源是带上ETag ,客户端请求时带上If-None-Match,服务端判断到资源未变时,响应 304 状态码。ETag 通常可以对资源计算MD5码后得到。

其它设置

          有些资源不适合用缓存,比如动态的数据,或者涉及安全的数据,所以Cache-Control 还有几个策略值:

          no-cache: 不缓存,客户端每次都要重新请求资源。

          Public :可以在代理服务器上缓存(比如客户的ISP上建立的代理服务器)

          Private :只能在客户端缓存,代理服务器不能缓存

          no-store :不保存到文件中

         

         另外还有些不常见的Cach-Control的设置,比如

         min-refresh: 在不到max-age时就去请求新资源

         max-stale  :  能够接受过期的内容

         另外,还有些涉及到代理服务器,CDN 如何更新缓存内容的一些策略控制。详细的内容可参考 http://tools.ietf.org/html/rfc2616#section-14.9 。

浏览器对缓存的处理

           浏览器根据以上的设置,以有用户操作,来决定缓存的处理方式:

       

           1) 打开新窗口 值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器。 而如果指定了max-age值,那么在此值内的时间里就不会重新访问服务器,例如: Cache-control: max-age=5(表示当访问此网页后的5秒内再次访问不会去服务器)

            2) 在地址栏回车 值为private或must-revalidate则只有第一次访问时会访问服务器,以后就不再访问。 值为no-cache,那么每次都会访问。 值为max-age,则在过期之前不会重复访问。

            3) 按后退按扭 值为private、must-revalidate、max-age,则不会重访问, 值为no-cache,则每次都重复访问

            4) 按刷新按扭 无论为何值,都会重复访问 Cache-control值为“no-cache”时,访问此页面不会在Internet临时文章夹留下页面备份。

           另外,通过指定“Expires”值也会影响到缓存。例如,指定Expires值为一个早已过去的时间,那么访问此网时若重复在地址栏按回车,那么每次都会重复访问: Expires: Fri, 31 Dec 1999 16:00:00 GMT 比如:禁止页面在IE中缓存 http响应消息头部设置: CacheControl = no-cache Pragma=no-cache Expires = -1 Expires是个好东东,如果服务器上的网页经常变化,就把它设置为-1,表示立即过期。  

JAVA 示例         

         最后说下java web环境下编程,用纯servlet解决就可以

//返回图片缩略图
public class ImageThumbnailServlet extends HttpServlet {

    public static final int SECOND_OF_ONE_DAY = 86400;

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        String uniq = getSourceName(req); //根据request 计算要下载的资源的名字
        contentType="image/jpeg";


        String etag=getETag(uniq);  //计算资源的ETag
        String ifNoneMatch = req.getHeader("If-None-Match");
        if(ifNoneMatch!=null && etag.indexOf(ifNoneMatch)!=-1{  //ETag相同就发送 响应 304
                resp.reset();
                resp.setStatus(HttpServletResponse.SC_NOT_MODIFIED);
                return;
        }

        FileInputStream fileInputSream = getFileInputSream(uniq); //得到文件流
        try {
            Long lastModified=getLastModified(uniq);
            Long expires=calcExpires();
            Long maxAge=calcMaxAge();
            resp.setHeader("Content-Type", contentType);
            resp.setHeader("Cache-Control","public,max-age="+maxAge);
            resp.addDateHeader("Expires", expires);
            resp.addDateHeader("Last-Modified",lastModified);
            resp.addHeader("ETag",etag);

            //发送流
            byte[] buffer = new byte[1024];
            int byteread;
            while ((byteread = fileInputSream.read(buffer)) != -1) {
                resp.getOutputStream().write(buffer, 0, byteread);
            }
        }finally {
            fileInputSream.close();
        }
    }

    //如果请求头中包含if-modified-since,必须实现这个接口,否则出错
    @Override
    protected long getLastModified(HttpServletRequest req) {
         String uniq = getSourceName(req); //根据request 计算要下载的资源的名字
         return getLastModified(uniq);
    }

    .......
}

相关推荐