afanti 2020-05-11
一般我们对缓存读操作的时候有这么一个固定的套路:
代码例子:
@Override public R selectOrderById(Integer id) { //查询缓存 Object redisObj = valueOperations.get(String.valueOf(id)); //命中缓存 if(redisObj != null) { //正常返回数据 return new R().setCode(200).setData(redisObj).setMsg("OK"); } Order order = orderMapper.selectOrderById(id); if (order != null) { valueOperations.set(String.valueOf(id), order); //加入缓存 return new R().setCode(200).setData(order).setMsg("OK"); } return new R().setCode(500).setData(new NullValueResultDO()).setMsg("查询无果"); }
但这样写的代码是不行的,这代码里就有我们缓存的三大问题的两大问题.穿透,击穿.
第一种情况:Redis挂掉了,请求全部走数据库.
第二种情况:缓存数据设置的过期时间是相同的,然后刚好这些数据删除了,全部失效了,这个时候全部请求会到数据库
缓存雪崩如果发生了,很有可能会把我们的数据库搞垮,导致整个服务器瘫痪.
对于第二种情况,非常好解决:
在存缓存的时候给过期时间加上一个随机值,这样大幅度的减少缓存同时过期.
第一种情况:
事发前:实现Redis的高可用(主从架构+Sentinel 或者Redis Cluster),尽量避免Redis挂掉这种情况发生。
事发中:万一Redis真的挂了,我们可以设置本地缓存(ehcache)+限流(hystrix),尽量避免我们的数据库被干掉(起码能保证我们的服务还是能正常工作的)
事发后:redis持久化,重启后自动从磁盘上加载数据,快速恢复缓存数据。
比如你抢了你同事的女神,你同事很气,想搞你,在你的项目里,每次请求的ID为负数.这个时候缓存肯定是没有的,缓存就没用了,请求就会全部找数据库,但数据库也没用这个值.所以每次返回空出去.
缓存穿透是指查询一个一定不存在的数据。由于缓存不命中,并且出于容错考虑,如果从数据库查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,失去了缓存的意义。
这就是缓存穿透:
请求的数据在缓存大量不命中,导致请求走数据库。
缓存穿透如果发生了,也可能把我们的数据库搞垮,导致整个服务瘫痪!
解决缓存穿透也有两种方案:
缓存空对象代码例子:
public R selectOrderById(Integer id) { return cacheTemplate.redisFindCache(String.valueOf(id), 10, TimeUnit.MINUTES, new CacheLoadble<Order>() { @Override public Order load() { return orderMapper.selectOrderById(id); } },false); }
public R redisFindCache(String key, long expire, TimeUnit unit, CacheLoadble<T> cacheLoadble, boolean b) { //查询缓存 Object redisObj = valueOperations.get(String.valueOf(key)); //命中缓存 if (redisObj != null) { if(redisObj instanceof NullValueResultDO){ return new R().setCode(500).setData(new NullValueResultDO()).setMsg("查询无果"); } //正常返回数据 return new R().setCode(200).setData(redisObj).setMsg("OK"); } try { T load = cacheLoadble.load();//查询数据库 if (load != null) { valueOperations.set(key, load, expire, unit); //加入缓存 return new R().setCode(200).setData(load).setMsg("OK"); }else{ valueOperations.set(key,new NullValueResultDO(),expire,unit); } } finally { } return new R().setCode(500).setData(new NullValueResultDO()).setMsg("查询无果"); }
这里封装了一个模板redisFindCache,不然每一个方法都要写这个流程.注意在命中缓存时,要判断数据是否是空对象.
空对象:
@Getter @Setter @ToString public class NullValueResultDO{ }
缓存空对象的缺点:有大量的空数据占用redis的内存.治标不治本.
布隆过滤器:
有谷歌的guava,但是是单机版的,不支持分布式.
也可以用redis的位数组bit手写一个分布式布隆过滤器,代码就不写了.过程就是先把id(比如你是用id为key的)存进布隆过滤器(会经过特定的算法),当我们请求接口的时候先让它查询布隆过滤器,判断数据是否存在.
上面的代码还有个缓存击穿(缓存当中没有,数据库中有)问题,就是并发的时候.比如99个人同时请求,还是会打印99条sql语句,还是会找数据库.
这里的代码是用的分布式锁(互斥锁)
public R redisFindCache(String key, long expire, TimeUnit unit, CacheLoadble<T> cacheLoadble,boolean b){ //判断是否走过滤器 if(b){ //先走过滤器 boolean bloomExist = bloomFilter.isExist(String.valueOf(key)); if(!bloomExist){ return new R().setCode(600).setData(null).setMsg("查询无果"); } } //查询缓存 Object redisObj = valueOperations.get(String.valueOf(key)); //命中缓存 if(redisObj != null) { //正常返回数据 return new R().setCode(200).setData(redisObj).setMsg("OK"); } // RLock lock0 = redisson.getLock("{taibai0}:" + key); // RLock lock1 = redisson.getLock("{taibai1}:" + key); // RLock lock2 = redisson.getLock("{taibai2}:" + key); // RedissonMultiLock lock = new RedissonMultiLock(lock0,lock1, lock2); try { redisLock.lock(key);//上锁 // lock.lock(); //查询缓存 redisObj = valueOperations.get(String.valueOf(key)); //命中缓存 if(redisObj != null) { //正常返回数据 return new R().setCode(200).setData(redisObj).setMsg("OK"); } T load = cacheLoadble.load();//查询数据库 if (load != null) { valueOperations.set(key, load,expire, unit); //加入缓存 return new R().setCode(200).setData(load).setMsg("OK"); } return new R().setCode(500).setData(new NullValueResultDO()).setMsg("查询无果"); }finally { redisLock.unlock(key);//解锁 // lock.unlock(); } }
如果仅仅查询的话,缓存的数据和数据库的数据是没问题的。但是,当我们要更新时候呢?各种情况很可能就造成数据库和缓存的数据不一致了。
从理论上说,只要我们设置了键的过期时间,我们就能保证缓存和数据库的数据最终是一致的。因为只要缓存数据过期了,就会被删除。随后读的时候,因为缓存里没有,就可以查数据库的数据,然后将数据库查出来的数据写入到缓存中。
除了设置过期时间,我们还需要做更多的措施来尽量避免数据库与缓存处于不一致的情况发生。
一般来说,执行更新操作时,我们会有两种选择:
首先,要明确的是,无论我们选择哪个,我们都希望这两个操作要么同时成功,要么同时失败。所以,这会演变成一个分布式事务的问题。
所以,如果原子性被破坏了,可能会有以下的情况:
如果第一步已经失败了,我们直接返回Exception出去就好了,第二步根本不会执行。
下面我们具体来分析一下吧。
操作缓存也有两种方案:
一般我们都是采取删除缓存缓存策略的,原因如下:
基于这两点,对于缓存在更新时而言,都是建议执行删除操作!
正常情况是这样的:
如果原子性被破坏了:
如果在高并发的场景下,出现数据库与缓存数据不一致的概率特别低,也不是没有:
要达成上述情况,还是说一句概率特别低:
因为这个条件需要发生在读缓存时缓存失效,而且并发着有一个写操作。而实际上数据库的写操作会比读操作慢得多,而且还要锁表,而读操作必需在写操作前进入数据库操作,而又要晚于写操作更新缓存,所有的这些条件都具备的概率基本并不大。
对于这种策略,其实是一种设计模式:Cache Aside Pattern
删除缓存失败的解决思路:
正常情况是这样的:
如果原子性被破坏了:
看起来是很美好,但是我们在并发场景下分析一下,就知道还是有问题的了:
所以也会导致数据库和缓存不一致的问题。
并发下解决数据库与缓存不一致的思路:
我们可以发现,两种策略各自有优缺点:
在高并发下表现不如意,在原子性被破坏时表现优异
在高并发下表现优异,在原子性被破坏时表现不如意
可以用databus或者阿里的canal监听binlog进行更新。
参考资料:
https://coolshell.cn/articles/17416.html
https://github.com/doocs/advanced-java/blob/master/docs/high-concurrency/redis-consistence.md
https://zhuanlan.zhihu.com/p/48334686
https://blog.csdn.net/z50l2o08e2u4aftor9a/article/details/81008933