今天，你遇到redis线上连接超时了吗？

MLXY 2020-05-17

一封报警邮件，大量服务节点 redis 响应超时。

又来，好烦。

redis 响应变慢，查看日志，发现大量 TimeoutException。

大量TimeoutException，说明当前redis服务节点上已经堆积了大量的连接查询，超出redis服务能力，再次尝试连接的客户端，redis 服务节点直接拒绝，抛出错误。

那到底是什么导致了这种情况的发生呢？

总结起来，我们可以从以下几方面进行关注：

一、redis 服务节点受到外部关联影响

redis服务所在服务器，物理机的资源竞争及网络状况等。同一台服务器上的服务必然面对着服务资源的竞争，CPU，内存，固存等。

1、CPU资源竞争

redis属于CPU密集型服务，对CPU资源依赖尤为紧密，当所在服务器存在其它CPU密集型应用时，必然会影响redis的服务能力，尤其是在其它服务对CPU资源消耗不稳定的情况下。

因此，在实际规划redis这种基础性数据服务时应该注意一下几点：

1）一般不要和其它类型的服务进行混部。

2）同类型的redis服务，也应该针对所服务的不同上层应用进行资源隔离。

说到CPU关联性，可能有人会问是否应该对redis服务进行CPU绑定，以降低由CPU上下文切换带来的性能消耗及关联影响？

简单来说，是可以的，这种优化可以针对任何CPU亲和性要求比较高的服务，但是在此处，有一点我们也应该特别注意：我们在关于redis内存分析，内存优化中介绍内存时，曾经提到过子进程内存消耗，也就是redis持久化时会fork出子进程进行AOF/RDB持久化任务。对于开启了持久化配置的redis服务（一般情况下都会开启），假如我们做了CPU亲和性处理，那么redis fork出的子进程则会和父进程共享同一个CPU资源，我们知道，redis持久化进程是一个非常耗资源的过程，这种自竞争必然会引发redis服务的极大不稳定。

2、内存不在内存了

关于redis内存分析，内存优化开篇就讲过，redis最重要的东西，内存。

内存稳定性是redis提供稳定，低延迟服务的最基本的要求。

然而，我们也知道操作系统有一个 swap 的东西，也就将内存交换到硬盘。假如发生了redis内存被交换到硬盘的情景发生，那么必然，redis服务能力会骤然下降。

swap发现及避免：

1）info memory：

关于redis内存分析，内存优化中我们也讲过，swap这种情景，此时，查看redis的内存信息，可以观察到碎片率会小于1。这也可以作为监控redis服务稳定性的一个指标。

2）通过redis进程查看。

首先通过 info server 获取进程id：

今天，你遇到redis线上连接超时了吗？

查看 redis 进程 swap 情况：cat /proc/1686/smaps

今天，你遇到redis线上连接超时了吗？

确定交换量都为0KB或者4KB。

3）redis服务maxmemory配置。

关于redis内存分析，内存优化中我们提到过，对redis服务必要的内存上限配置，这是内存隔离的一种必要。需要确定的是所有redis实例的分配内存总额小于总的可用物理内存。

4）系统优化：

另外，在最初的基础服务操作系统安装部署时，也需要做一些必要的前置优化，如关闭swap或配置系统尽量避免使用。

3、网络问题

网络问题，是一个普遍的影响因素。

1）网络资源耗尽

简单来说，就是带宽不够了，整个属于基础资源架构的问题了，对网络资源的预估不足，跨机房，异地部署等都会成为诱因。

2）连接数用完了

一个客户端连接对应着一个TCP连接，一个TCP连接在LINUX系统内对应着一个文件句柄，系统级别连接句柄用完了，也就无法再进行连接了。

查看当前系统限制：ulimit -n

设置：ulimit -n {num}

3）端口TCP backlog队列满了

linux系统对于每个端口使用backlog保存每一个TCP连接。

redis配置：tcp_backlog 默认511

今天，你遇到redis线上连接超时了吗？

高并发情境下，可以适当调整此配置，但需要注意的是，同时要调整系统相关设置。

系统修改命令：echo {num}>/proc/sys/net/core/somaxconn

查看因为队列溢出导致的连接绝句：netstat -s | grep overflowed

今天，你遇到redis线上连接超时了吗？

4）网络延迟

网络质量问题，可以使用 redis-cli 进行网络状况的测试：

延迟测试：redis-cli -h {host} -p {port} --latency

今天，你遇到redis线上连接超时了吗？

采样延迟测试：redis-cli -h {host} -p {port} --latency-history 默认15s一次

图形线上测试结果：redis-cli -h {host} -p {port} --latency-dist

今天，你遇到redis线上连接超时了吗？

4）网卡软中断

单个网卡队列只能使用单个CPU资源问题。

二、redis 服务使用问题

1、慢查询

如果你的查询总是慢查询，那么必然你的使用存在不合理。

1）你的key规划是否合理

太长或太短都是不建议的，key需要设置的简短而有意义。

2）值类型选择是否合理。

hash还是string，set还是zset，避免大对象存储。

线上可以通过scan命令进行大对象发现治理。

3）是否能够批查询

get 还是 mget；是否应该使用pipeline。

4）禁止线上大数据量操作

2、redis 服务运行状况

查看redis服务运行状况：redis-cli -h {host} -p {port} --stat

今天，你遇到redis线上连接超时了吗？

keys：当前key总数；mem：内存使用；clients：当前连接client数；blocked：阻塞数；requests：累计请求数；connections：累计连接数

3、持久化操作影响

1）fork子进程影响

redis 进行持久化操作需要fork出子进程。fork子进程本身如果时间过长，则会产生一定的影响。

查看命令最近一次fork耗时：info stats

今天，你遇到redis线上连接超时了吗？

单位微妙，确保不要超过1s。

2）AOF刷盘阻塞

AOF持久化开启，后台每秒进行AOF文件刷盘操作，系统fsync操作将AOF文件同步到硬盘，如果主线程发现距离上一次成功fsync超过2s，则会阻塞后台线程等待fsync完成以保障数据安全性。

3）THP问题

关于redis内存分析，内存优化中我们讲过透明大页问题，linux系统的写时复制机制会使得每次写操作引起的页复制由4KB提升至2M从而导致写慢查询。如果慢查询堆积必然导致后续连接问题。

: MLXY

相关推荐

快速制作Redis Docker镜像

现在容器化已经是趋势，制作镜像也是我们的基础工作。镜像越小，部署起来越方便。在这个方面，轻巧的Linux发行版本就是一个很好的选择，这里我们选择alpine linux 。目前最新版本是3.12.1。官方很友好的提供了minirootfs的包，这个包就是为

王道革 0喜欢 / 0评论 2020-11-25

Go+Vue开发一个线上外卖应用的流程(用户名密码和图形验证码)

在使用用户名和密码登录功能时，需要填写验证码，验证码是以图形化的方式进行获取和展示的。验证通过即可继续进行登录。借助开源的验证码工具库可以生成验证码。第一个example是用于演示生成验证码和验证码的示例代码。当验证码生成后，将验证码存放在Redis中，并

wangdonghello 0喜欢 / 0评论 2020-11-03

Windows安装Redis并添加本地自启动服务的实例详解

在windows本地搭建redis缓存，添加到本地计算机的服务中，保证每次开机自动启动服务。解压缩包，拷贝文件夹到计算机指定的磁盘下。然后编辑redis.windows.conf文件，设置redis的密码：找到# requirepass foobared

Langeldep 0喜欢 / 12评论 2020-11-16

Redis客户端及服务端的安装教程详解

本系列将和大家分享Redis分布式缓存，本文是该系列的开篇，主要简单介绍下Redis客户端及服务端的安装。基于内存管理，实现了5种数据结构，单线程模型的应用程序，对外提供插入--查询--固化--集群功能。但是不能当数据库，不能作为数据的最终依据。单线程多进

chenhualong0 0喜欢 / 0评论 2020-11-16

Redis中的String类型及使用Redis解决订单秒杀超卖问题

本系列将和大家分享Redis分布式缓存，本章主要简单介绍下Redis中的String类型，以及如何使用Redis解决订单秒杀超卖问题。Redis中5种数据结构之String类型：key-value的缓存，支持过期，value不超过512M。Redis是单线

聚合室 0喜欢 / 0评论 2020-11-16

详解Redis数据结构之跳跃表

我们先不谈Redis，来看一下跳表。还要支持输入道具名称的精确查询和不输入名称的全量查询。拍卖行商品列表是线性的，最容易表达线性结构的是数组和链表。每个元素均关联一个double类型的score，Redis 根据score进行从小到大排序；这个是 Redi

koushr 0喜欢 / 0评论 2020-11-12

Linux下redis5.0.5的安装过程与配置方法

先将 redis-5.0.5 里的配置文件 redis.conf 移动到刚创建的 config 文件夹。注释掉 bind 127.0.0.1 这一行。将 protected-mode 属性改为 no

MRFENGG 0喜欢 / 5评论 2020-11-11

Redis 的 GeoHash详解

Redis 在 3.2 版本以后增加了地理位置 GEO 模块，意味着我们可以使用 Redis 来实现摩拜单车「附近的 Mobike」、美团和饿了么「附近的餐馆」这样的功能了。比如掘金办公室在望京 SOHO，它的经纬度坐标是，都是正数，因为中国位于东北半球

guoyanga 0喜欢 / 0评论 2020-11-10

通过kubesphere部署redis的方法

docker run --name redis -p 6379:6379 -d --restart=always a4d3716dbb72 redis-server --appendonly yes --requirepass "123456&q

fackyou00 0喜欢 / 0评论 2020-11-10

为啥Redis使用pipelining会更快

为啥Redis使用pipelining会更快？为什么执行结果相差如此之大呢？因为这是连接本地的redis，所以网络开销非常小，当然，这里仍然有一部分是网络开销影响，可是除此之外是否还有其它影响因素呢？答案是有，比如OS进程调度，当不使用管道时，Redis处

Orangesss 0喜欢 / 0评论 2020-11-03

基于Redis+Lua脚本实现分布式限流组件封装的方法

<artifactId>spring-boot-starter-data-redis</artifactId>. -- Created by IntelliJ IDEA.local count = tonumber(redis.ca

dongCSDN 0喜欢 / 0评论 2020-10-31

Redis概述及linux安装redis的详细教程

性能极高，Redis能读的速度是110000次/s,写的速度是81000次/s 。Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set

rainandtear 0喜欢 / 1评论 2020-10-30

Redis常用数据类型命令实例汇总

存储：zadd key score menber1 score menber2 ...删除指定的key：del key1 key2...获取所有与pattern匹配的key： keys pattern 。

Quietboy 0喜欢 / 0评论 2020-10-30

解密Redis助力双11背后电商秒杀系统(推荐)

秒杀活动是绝大部分电商选择的低价促销，推广品牌的方式。既可以给平台带来用户量，还可以提高平台知名度。一个好的秒杀系统，可以提高平台系统的稳定性和公平性，获得更好的用户体验，提升平台的口碑，从而提升秒杀活动的最大价值。本文讨论云数据库Redis版缓存设计高并

liuyulong 0喜欢 / 0评论 2020-10-29

硬核！15张图解Redis为什么这么快(推荐)

作为一名服务端工程师，工作中你肯定和 Redis 打过交道。Redis为什么快，这点想必你也知道，至少为了面试也做过准备。很多人知道Redis快仅仅因为它是基于内存实现的，对于其它原因倒是模棱两可。Redis 是基于内存的数据库，那不可避免的就要与磁盘数据

fansili 0喜欢 / 0评论 2020-10-29

Redis持久化RDB和AOF区别详解

触发机制--主要三种方式。主进程通过fork()函数，创建子进程生成DRB文件，在此期间访问redis仍然能正常响应。save 300 10 #300秒修改了10次就自动生成RDB文件。stop-writes-on-bgsave-error yes #b

温攀峰 0喜欢 / 0评论 2020-10-23

关于使用IDEA的springboot框架往Redis里写入数据乱码问题

解决方法：在你RedisUtil类里加入下图红框的的代码，

vapaad 0喜欢 / 0评论 2020-10-22

Redis 对过期数据的处理方法

惰性删除不会去主动删除数据，而是在访问数据的时候，再检查当前键值是否过期，如果过期则执行删除并返回 null 给客户端，如果没有过期则返回正常信息给客户端。它的优点是简单，不需要对过期的数据做额外的处理，只有在每次访问的时候才会检查键值是否过期，缺点是删除

jackbon 0喜欢 / 0评论 2020-10-19

redis中scan命令的基本实现方法

在一个天朗气清的日子，小灰登上了线上的redis打算查询数据。然而他只记得前缀而不知道整个键是多少，于是在命令行敲入了“keys xxx*”命令。瞬间服务卡死，报警邮件堆满了邮箱，而小灰，只能目瞪狗呆的等待着即将降临的case study。基本上，keys

kaixinfelix 0喜欢 / 0评论 2020-10-04

详解centos7 yum安装redis及常用命令

Redis是一种基于内存的数据结构存储，可持久化的日志型、Key-Value数据库。使用关系型数据库的站点达到一定并发量的时候，往往在磁盘IO上会有瓶颈，这时候配合redis就有一定的优势，因为它具有以下几个特性：。基于内存运行，高并发读写；支持分布式，理

xiemanR 0喜欢 / 0评论 2020-09-21

springboot +redis 实现点赞、浏览、收藏、评论等数量的增减操作

最近做了一个帖子的收藏、点赞数量的功能，其实之前也做过类似的功能，因为之前一直使用的mysql 总是感觉对于这种频繁需要改变的值，不应该给予Mysql过大的压力，本文章采用的是redis 做了持久化。下面贴出关键代码：DataResponse是项目中使用的

零 0喜欢 / 0评论 2020-09-18

Redis的Expire与Setex区别说明

设置 key对应的值为 string类型的 value。如果key 已经存在，返回 0，nx 是not exist 的意思。由于原来 name 有一个对应的值，所以本次的修改不生效，且返回码是 0。可见由于最后一次的调用是10 秒以后了，所以取不到 hai

anglehearts 0喜欢 / 0评论 2020-09-15

php redis setnx分布式锁简单原理解析

我就废话不多说了，大家还是直接看代码吧~如果一个请求更新缓存的时间比较长，甚至比锁的有效期还要长，导致在缓存更新过程中，锁就失效了，此时另一个请求会获取锁，但前一个请求在缓存更新完毕的时候，如果不加以判断直接删除锁，就会出现误删除其它请求创建的锁的情况，所

savorTheFlavor 0喜欢 / 2评论 2020-10-23

程序员必懂的Redis技术实战

Redis是现在很受欢迎的NoSQL数据库之一，目前广泛用于缓存系统、分布式锁、计数器、消息队列系统、排行榜、社交网络等场景中，本篇文章成哥为大家带来redis日常使用实践，及通过代码实现redis的分布式锁。Redis通过IO多路复用解决单线程下并发客户

smartbaby 0喜欢 / 0评论 2020-11-11

Redis+Node.js实现一个能处理海量数据的异步任务队列系统

在最近的业务中，接到了一个需要处理约十万条数据的需求。这些数据都以字符串的形式给到，并且处理它们的步骤是异步且耗时的。如果以串行的方式实现，其耗时是相当长的：。经过调研后发现，使用异步任务队列是个不错的办法。当任务队列为空，表示所有任务已经被认领完；当所有

czfphper 0喜欢 / 0评论 2020-10-28

Python操作Redis大全

Python操作Redis的redis模块对字符串的主要操作函数包括：SET、GET、GETSET、SETEX、SETNX、MSET、MSETNX、INCR、APPEND、SETRANGE、STRLEN。Python操作Redis主要利用了redis模块来

chaochao 0喜欢 / 11评论 2020-10-27

一文讲清RedisCluster

节点之间完成相互通信的基础，有一定的频率和规则。CLUSTER MEET命令被用来连接不同的开启集群支持的 Redis 节点，以进入工作集群。如果接收的节点已经将发送节点信任为已知节点，它会处理 gossip 部分并且发送一个握手消息给未知的节点。由于在心

itbird 0喜欢 / 10评论 2020-10-26

原来缓存也会雪崩、击穿、穿透啊

仅靠着超高配置的服务器资源，还是很难支撑高并发的场景。因此我们需要缓存。比如双十一的时候，iPhone12在凌晨00:00-01:00可1分钱抢购，哇，这个可是真便宜呢，程序员们也预测到了商品的火爆，于是将iPhone12的商品信息缓存到redis中，设置

天空一样的蔚蓝 0喜欢 / 0评论 2020-10-23

终于把Redis场景设计搞清楚了，需要掌握的都在这了

分布式缓存是分布式系统中的重要组件，主要解决高并发、大数据场景下，热点数据访问的性能问题，提供高性能的数据快速访问。使用缓存常见场景是：项目中部分数据访问比较频繁，对下游 DB造成服务压力，这时候可以使用缓存来提高效率。下面来讲BAT等一线企业中Redis

天空一样的蔚蓝 0喜欢 / 0评论 2020-10-15

Redis面试8连问，你能顶住几道？

出现实例宕机自动进行主备切换，配置读写分离缓解Master读写压力。使用官方推荐的哨兵机制就能实现，当主节点出现故障时，由Sentinel自动完成故障发现和转移，并通知应用方，实现高可用性。集群监控，负责监控redis master和slave进程是否正常

聚合室 0喜欢 / 0评论 2020-09-30

记一次生产事故：30万单就这样没了！

你好，我是彤哥。昨天晚上下班回家，在地铁上，老大突然打来电话，B系统生产环境响应缓慢，影响了A系统的使用，几万小哥收不了单，大概有30万单卡住了，你去帮忙定位一下。我8点半左右到家，立马上线入会。事实证明，重启后走一波压测依然没什么用，1000个并发，平均

redis 0喜欢 / 0评论 2020-09-25

redis的设计及使用场景

redis是一个完全开源的，高性能的key-value数据库，特点是：支持原子性、持久化、丰富的数据类型。在使用redis的时候，要注意的key设计，这样易于维护，考虑持久化策略，以防在服务异常的时候快速的恢复数据；考虑系统的安全策略，不能使用key *命

夙梦流尘 0喜欢 / 0评论 2020-09-23

springboot redis lua脚本分布式锁

* @param value redis的value要求是随机串，防止释放其他请求的锁。* @param expireTime redis的key 的过期时间防止死锁，导致其他请求无法正常执行业务。String script =

峰哥 0喜欢 / 0评论 2020-09-23

SpringBoot 项目接入 Redis 集群

本文转载自微信公众号「Java极客技术」，作者鸭血粉丝。但是 Redis 的集群估计并不是每个人都会用到，因为很多业务场景或者系统都是一些简单的管理系统，并不会需要用到 Redis 的集群环境。阿粉之前也是这样，项目中用的的 Redis 是个单机环境，

zhouminit 0喜欢 / 0评论 2020-09-23

redis批量删除key的步骤

本文分享最新版Redis批量删除key的方法，希望能帮到遇到同样问题的网友。例如key是”123 4566″，传送到管道后面删除，就变成了删除两个key，与预期不符合。xargs使用占位符，删除key时将整个结果传过去，避免了空格问题。改正后的命令在本人的

anglehearts 0喜欢 / 0评论 2020-09-09

查看Redis内存信息的命令

info 命令用于监控Redis运行情况，其中 info memory 可以查看Redis内存使用统计信息：。Keys命令性能很不好，线上使用该命令简直是业务克星，因此建议生产环境屏蔽Keys命令。运行结果按照从小到大的顺序给出了内存占用最高的10个Key

xiancaione 0喜欢 / 0评论 2020-09-08

浅析redis cluster介绍与gossip协议

redis cluster架构下的每个redis都要开放两个端口号，比如一个是6379，另一个就是加1w的端口号16379。16379端口号是用来进行节点间通信的，也就是 cluster bus 的东西，cluster bus 的通信，用来进行故障检测、配

txj 0喜欢 / 0评论 2020-09-08

详解Redis的慢查询日志

DiamondTao 0喜欢 / 0评论 2020-08-30

如何高效使用Redis作为LRU缓存

当用Redis作为一个LRU存储时，有些时候是比较方便的，在你增添新的数据时会自动驱逐旧的数据。这种行为在开发者论坛是非常有名的，因为这是流行的memcached系统的默认行为。LRU实际上只是支持驱逐的方式之一。这页包含更多一般的Redis maxmem

xiemanR 0喜欢 / 0评论 2020-08-29

WINDOWS中REDIS主从配置实现代码解析

　　redis-server --service-install redis.windows.conf --maxmemory 200m--service-name redis6380. 　　②，客户端，在客户端可获取主客户端添加的数据，但是无法写入数据

了凡 0喜欢 / 0评论 2020-09-16

Redis migrate数据迁移工具的使用教程

在工作中可能会遇到单点Redis向Redis集群迁移数据的问题，但又不能老麻烦运维来做。为了方便研发自己迁移数据，我这里写了一个简单的Redis迁移工具，希望对有需要的人有用。该工具已经编译成了多平台命令，直接从Github下载二进制文件执行就好了。把代码

afanti 0喜欢 / 0评论 2020-09-16

Redis处理高并发机制原理及实例解析

非阻塞IO 内部实现采用epoll，采用了epoll+自己实现的简单的事件框架。epoll中的读、写、关闭、连接都转化成了事件，然后利用epoll的多路复用特性，绝不在io上浪费一点时间。因为Redis是基于内存的操作，CPU不是Redis的瓶颈，Redi

温攀峰 0喜欢 / 0评论 2020-09-16

Docker批量容器编排的实现

Dockerfile build run 是手动操作单个容器，假如使用微服务架构，需要启动 100 + 个容器，他们之间的依赖关系如何维护？Docker Compose 用来轻松高效地管理容器，定义运行多个容器。redis_1 | 1:C 12 Sep 2

afanti 0喜欢 / 0评论 2020-09-14

面试被问到Redis实现发布与订阅，手摸手教

Redis发布与发布功能是基于事件座位基本的通信机制，是目前应用比较普遍的通信模型，它的目的主要是解除消息的发布者与订阅者之间的耦合关系。Redis同时也可以使用list类型实现消息队列。简介完Redis的发布于订阅功能，下面就要来实操一下，包括linux

ljz0 0喜欢 / 0评论 2020-09-15

通过Node和Redis进行API速率限制

速率限制可以保护和提高基于API的服务的可用性。如果你正在与一个API对话，并收到HTTP 429 Too Many Requests的响应状态码，说明你已经被速率限制了。这意味着你超出了给定时间内允许的请求数量。你需要做的就是放慢脚步，稍等片刻，然后再

redis 0喜欢 / 0评论 2020-09-07

Redis数据增多了，是该加内存还是加实例？

我曾遇到过这么一个需求：要用 Redis 保存 5000 万个键值对，每个键值对大约是 512B，为了能快速部署并对外提供服务，我们采用云主机来运行 Redis 实例，那么，该如何选择云主机的内存容量呢?所以，当时，我想到的第一个方案就是：选择一台 32

天空一样的蔚蓝 0喜欢 / 0评论 2020-09-04

拆解Redis Cluster，怎么实现“写安全”这个重要特性？

Redis是非常流行的缓存。在Redis升级到3.0版本后，升级到集群版本，被称之为Redis Cluster。在集群版本中，会将数据分成多份，被保存到多个server中，从而保证集群的水平扩展能力，加之每份数据保存多个副本，从而保证可用性，并且集群版本

soyo 0喜欢 / 0评论 2020-08-31

熬了一个通宵，终于把Reids的7千万个Key删完了，今天脑子都嗡嗡响！

由于有一条业务线不理想，高层决定下架业务。对于我们技术团队而言，其对应的所有服务器资源和其他相关资源都要释放。释放了8台应用服务器；1台es服务器；删除分布式定时任务中心相关的业务任务；备份并删除MySQL数据库；删除Redis中相关的业务缓存数据。CTO

天空一样的蔚蓝 0喜欢 / 0评论 2020-08-24

Redis复制、哨兵和集群的流程图整理了一遍

最近在二刷《Redis设计与实现》，顺便把Redis的源码也撸了一遍。流程图使用OmniGraffle做的，为了方便分析尽量都对每个流程按照不同视角或是不能功能部分分了图层处理。以下也都会先以分图层展示，最后再合并展示主流程。以上源文件可以私信我索取。源代

zghover 0喜欢 / 0评论 2020-08-19

redis中save和bgsave区别

SAVE 直接调用 rdbSave ，阻塞 Redis 主进程，直到保存完成为止。在主进程阻塞期间，服务器不能处理客户端的任何请求。BGSAVE 则 fork 出一个子进程，子进程负责调用 rdbSave ，并在保存完成之后向主进程发送信号，通知保存已完成

kaixinfelix 0喜欢 / 0评论 2020-08-19