kjfcpua 2017-09-11
互联网架构 -- 负载均衡
什么是负载均衡
负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。
常见的负载均衡方案
常见互联网分布式架构分为:客户端层、反向代理nginx层、站点层、服务层、数据层。可以看到,每一个下游都有多个上游调用,只需要做到,每一个上游都均匀访问每一个下游,就能实现“将请求/数据【均匀】分摊到多个操作单元上执行”。
【客户端层->反向代理层】的负载均衡
通过“DNS轮询”来实现这一层的负载均衡:DNS-server对于一个域名配置了多个解析ip,每次DNS解析请求来访问DNS-server,会轮询返回这些ip,保证每个ip的解析概率是相同的。这些ip就是nginx的外网ip,以做到每台nginx的请求分配也是均衡的。
【反向代理层->站点层】的负载均衡
这一层的负载均衡,是通过“nginx”实现的。通过修改nginx.conf,可以实现多种负载均衡策略:
【客户端层->站点层】的负载均衡
其实从客户端层到站点层,可以不用nginx和DNS轮询,用云平台(AWS、阿里云、腾讯云)做负载均衡,也同样能解决问题。而且维护起来更加简单方便,还能有流量报告,减少和增加服务也更加方便。然后再用nginx做反向代理层,通过Nginx 服务器,才能访问到真正的web服务器。
【站点层->服务层】的负载均衡
服务层的负载均衡是通过“服务连接池”实现的。上游连接池会建立与下游服务多个连接,每次请求会“随机”选取连接来访问下游服务。
【数据层】的负载均衡
在数据量很大的情况下,由于数据层(db,cache)涉及数据的水平切分,所以数据层的负载均衡更为复杂一些,它分为“数据的均衡”,与“请求的均衡”。
按照范围水平拆分
每一个数据服务,存储一定范围的数据,上图为例:
优点
缺点
按照哈希水平拆分
每一个数据库,存储某个key值hash后的部分数据,上图为例:
优点
缺点
总结
负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。