zookeeper实现namenode的高可用(HA)(第三篇)

idlerbm 2016-03-27

此篇的目的是怎么检错以及原理

192.168.159.31(node1) Namenode

192.168.159.32(node2) zookeeper Datanode JN(JournalNode)

192.168.159.33(node3) zookeeper Datanode JN

192.168.159.34(node4) zookeeper Datanode JN

192.168.159.35(node5) Namenode

zookeeper实现namenode的高可用(HA)(第三篇)

如上图:

namenode之间需要保持一样的元数据,包括fsimage和edits,edits文件会从active的namenode直接写在JN上

在node1上 start-dfs.sh后若哪个节点没有启动

这个时候最直接的检错方法是查看日志

日志在hadoop/logs日志目录中,哪个节点出错了,就去哪个节点上查看相对应的日志即可

比如:杀死node1后,node5的状态还是standby,此时就需要在node5上查看

tail -100 hadoop-root-zkfc-node5.log 里面会详细的记录为什么zookeeper没有选举node5位active

: idlerbm

高可用架构怎么选？常见多活建设这么一对比就懂了

采用高可用系统架构支持重要系统，为关键业务提供7x24的不间断服务，已经成为众多企业保障业务稳定、持续运转的主要选择。服务多活是高可用架构重要实施手段，本文介绍了一些业界常用的多活手段，例如同城双活、两地三中心、异地多活架构设计方案并详述了各种方案的优缺点

xuedabao 0喜欢 / 0评论 2020-11-19

MySQL 8.0.15配置MGR单主多从的方法

MySQL Group Replication字面意思是mysql组复制的意思,但其实他是一个高可用的集群架构,暂时只支持mysql5.7和mysql8.0版本.也是mysql官方基于组复制概念并充分参考MariaDB Galera Cluster和Per

暗夜之城 0喜欢 / 5评论 2020-11-11

程序员必懂的Redis技术实战

Redis是现在很受欢迎的NoSQL数据库之一，目前广泛用于缓存系统、分布式锁、计数器、消息队列系统、排行榜、社交网络等场景中，本篇文章成哥为大家带来redis日常使用实践，及通过代码实现redis的分布式锁。Redis通过IO多路复用解决单线程下并发客户

smartbaby 0喜欢 / 0评论 2020-11-11

这样做RabbitMQ高可用，业务流量猛增10倍也不怂

vivo 在 2016 年引入 RabbitMQ，基于开源 RabbitMQ 进行扩展，向业务提供消息中间件服务。2019年，RabbitMQ 进入高可用建设阶段，完成了高可用组件 MQ 名字服务以及 RabbitMQ 集群的同城双活建设。在 2019 年

WoogeYu 0喜欢 / 12评论 2020-11-10

TCP接入层的负载均衡、高可用、扩展性架构

今天和大家系统性聊聊TCP的负载均衡，高可用，与扩展性架构。互联网架构中，web-server接入一般使用nginx来做反向代理，实施负载均衡。整个架构分三层：。上游调用层，一般是browser或者APP;中间反向代理层，nginx;下游真实接入集群，we

liupengqwert 0喜欢 / 11评论 2020-10-28

Redis面试8连问，你能顶住几道？

出现实例宕机自动进行主备切换，配置读写分离缓解Master读写压力。使用官方推荐的哨兵机制就能实现，当主节点出现故障时，由Sentinel自动完成故障发现和转移，并通知应用方，实现高可用性。集群监控，负责监控redis master和slave进程是否正常

聚合室 0喜欢 / 0评论 2020-09-30

Kafka突然宕机了？稳住，莫慌！

问题要从一次 Kafka 的宕机开始说起。笔者所在的是一家金融科技公司，但公司内部并没有采用在金融支付领域更为流行的 RabbitMQ，而是采用了设计之初就为日志处理而生的 Kafka，所以我一直很好奇 Kafka 的高可用实现和保障。从 Kafka 部

guicaizhou 0喜欢 / 0评论 2020-09-30

容器云平台No.2~kubeadm创建高可用集群v1.19.1

通过kubernetes构建容器云平台第二篇，最近刚好官方发布了V1.19.0，本文就以最新版来介绍通过kubeadm安装高可用的kubernetes集群。市面上安装k8s的工具很多，但是用于学习的话，还是建议一步步安装，了解整个集群内部运行的组件，以便后

xingyuzhe 0喜欢 / 0评论 2020-09-21

HA（高可用）就像套娃，像胖子，剥掉一层还有一层

目前HTTP协议，乃至WebSocket协议，乃至采用了MQTT协议的WebSocket协议，都不可避免的使用了Nginx。所谓病从口入，祸从口出。作为入口，Nginx承担的责任非常的重要。假如某个时刻不能用了，那可真是灾难。我们通常希望在高可用的时候，同

lwplvx 0喜欢 / 0评论 2020-09-07

聊一聊mycat数据库集群系列之双主双重实现

点滴技术生活 0喜欢 / 0评论 2020-08-21

Redis服务之高可用组件sentinel详解

有没有这样的一组件帮我们对master做实时的监控，一旦发现master宕机就提升一个slave当选新的master，如果原master还有其他slave，将其他slave都从属于新的master；除此之外它还应该让系统在发生切换master时触发报警通知

wera00 0喜欢 / 0评论 2020-08-17

第六章 Redis高可用sentinel

Sentinel 是一个监视器，它可以根据被监视实例的身份和状态来判断应该执行何种动作。Sentinel会不断地检查你的主服务器和从服务器是否运作正常。当被监控的某个Redis服务器出现问题时，Sentinel可以通过API向管理员或者其他应用程序发送通知

凌风郎少 0喜欢 / 0评论 2020-08-02

Redis从入门到深入-主从复制(22)

经存在丢失的情况，必须进行第二次全量复制，致使slave陷入死循环状态。

八角塘塘主 0喜欢 / 0评论 2020-07-28

MySQL高可用之PXC

基于Galera的高可用方案主要有MariaDB Galera Cluster和Percona XtraDB Cluster，目前PXC架构在生产线上用的更多而且更成熟一些。而且节点与节点之间，它们互相的关系是对等的。PXC是在存储引擎层实现的同步复制，而

adsadadaddadasda 0喜欢 / 0评论 2020-07-19

MySQL 高可用之MMM

MySQL本身没有提供replication failover的解决方案，通过MMM方案能实现服务器的故障转移，从而实现mysql的高可用。当主服务器挂掉以后，另一个主立即接管，其他的从服务器能自动切换，不用人工干预。MMM方案并不太适应于对数据安全性要

huanglgln 0喜欢 / 0评论 2020-07-19

MySQL高可用之MHA

MHA Node运行在每台 MySQL服务器上，MHA Manager会定时探测集群中的master节点，当master出现故障时，它可以自动将最新数据的slave提升为新的master，然后将所有其他的slave重新指向新的master。整个故障转移过

herohope 0喜欢 / 0评论 2020-07-19

一次教科书级别的Redis高可用架构设计实践

Redis Server 节点：每个节点有一主一从两个实例，多个节点组成一份完整的集群数据，其中每个节点只有主库对外提供服务，从库仅仅用于节点高可用、数据持久化及定时备份。Zookeeper 集群：由五个 zk 节点组成，Redis 集群配置变更后，通知客

有梦就能飞 0喜欢 / 0评论 2020-07-14

MySQL高可用之PXC

CosEmon 0喜欢 / 0评论 2020-07-05

Redis持久化

Redis是一种高级key-value数据库。它跟memcached类似，不过数据可以持久化，而且支持的数据类型很丰富。有字符串，链表，集合和有序集合。支持在服务器端计算集合的并，交和补集等，还支持多种排序功能。所以Redis也可以被看成是一个数据结构服

mengtianbao 0喜欢 / 0评论 2020-06-26

高并发系统设计（四）：【系统设计目标②】系统怎样做到高可用？

通常来讲，一个高并发大流量的系统，系统出现故障比系统性能低更损伤用户的使用体验。MTTR表示故障的平均恢复时间，也可以理解为平均故障时间。模块之间通过RPC框架来调用，超时时间是默认的30秒。而除了提供必要回滚方案，以便在出现问题时快速回滚恢复之外，另一个

yourFriend 0喜欢 / 0评论 2020-06-25

高可用集群架构Keepalived双主热备

双机主备的缺点： Nginx主和Nginx被两台云服务器的配置要保持一致。访问两台服务器不发生故障的情况下，备用节点永远访问不上，将造成服务器资源的浪费。可以发现129上有192.168.127.161和192.168.127.162 两个虚拟IP，www

MichelinMessi 0喜欢 / 0评论 2020-06-21

Redis介绍及安装

Memcached：适合多用户访问，每个用户少量的读写。Memcached：多核的缓存服务，更加适合于多用户并发访问次数较少的应用场景。

ZHANGYONGHAO0 0喜欢 / 0评论 2020-06-17

大型网站系统架构实践（三）如何提高网站的高可用和高性能

随着网站的业务越来越多，网站的服务就变的很重要，假设某天你的服务器挂了，会不会是一个天大的灾难呢？而且这种事情发生的概率还不小，断电了，服务器硬盘坏了，内存坏了等等，都会使你的系统挂掉，而且高并发的访问有时候也会使系统资源耗尽，然后导致服务器宕机，那么解决

快乐de馒头 0喜欢 / 0评论 2020-06-16

超详细实战教程丨多场景解析如何迁移Rancher Server

作者介绍王海龙，Rancher中国社区技术经理，负责Rancher中国技术社区的维护和运营。拥有6年的云计算领域经验，经历了OpenStack到Kubernetes的技术变革，无论底层操作系统Linux，还是虚拟化KVM或是Docker容器技术都有丰富的运

薛正华 0喜欢 / 0评论 2020-06-15

Mysql通过MHA实现高可用

MHA是一款开源的 MySQL 的高可用程序，它为 MySQL 主从复制架构提供了 automating master failover 功能。MHA 在监控到 master 节点故障时，会提升其中拥有最新数据的 slave 节点成为新的master 节点

KFLING 0喜欢 / 0评论 2020-06-13

hadoop 3.2.x 高可用集群搭建

配置 hadoop 高可用集群的原因：如果集群只有一个 NameNode，若NameNode 节点出现故障，那么整个集群都无法使用，也就是存在单点故障的隐患，hadoop 高可用集群能够实现 standby NameNode 自动切换为 active。HA

飞鸿踏雪0 0喜欢 / 0评论 2020-06-12

15.HA高可用

HA即高可用，实现高可用最关键的策略就是消除单点故障。HA严格地来说应该分成各个组件的HA机制，HDFS的HA和YARN的HA。Hadoop2.0之前，在HDFS集群中NameNode存在单点故障。HDFS HA功能通过配置Active/Standby两个

sujins 0喜欢 / 0评论 2020-06-10

ZooKeeper核心原理及应用场景

一个消息通过网络在两个节点之间传递时，网络如果发生故障，发送方并不知道接收方是否接收到了这个消息。有可能是收到消息以后发生了网络故障，也有可能是没有收到消息，又或者可能接收方的进程死了。发送方唯一的确认方法就是再次连接发送消息，并向他进行询问。就是因为这样

MrZhangAdd 0喜欢 / 0评论 2020-06-09

corosync+pacemaker高可用集群

高可用集群，是指以减少服务中断时间为目的的服务器集群技术。简单的说，集群就是一组计算机，它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点。高可用集群的出现是为了减少由计算机硬件和软件易错性所带来的损失。高可用集群软件的主要作用就是

OwenJi 0喜欢 / 0评论 2020-06-08

聊一聊高并发高可用那些事 - Kafka篇

偶尔推出一个优惠活动时，请求量极速上升。看了几个招聘网站，提到较多的消息队列有：RabbitMQ、RocketMQ、Kafka 以及 Redis 的消息队列和发布订阅模式。在高可用环境中，Kafka 需要部署多台，避免 Kafka 宕机后，服务无法访问。K

meilongwhpu 0喜欢 / 0评论 2020-06-08

Nginx + Keepalived 双机热备

虚拟路由冗余协议是解决局域网中配置静态网关出现单点失效现象的路由协议，通过将多台设备虚拟化成一台设备，如果其中一台设备出现故障，那么另一台设备可以迅速接替其工作，已保证通讯的可靠性和连续性。Keepalived 软件是基于 VRRP 协议实现的，用来解决

zwmnhao0 0喜欢 / 0评论 2020-06-07

某二手交易平台大数据平台从 0 到 1 演进与实践

在人口流量红利不再，获客成本越来越高的时代，精益创业、MVP 的概念已经深入人心，精细化运营也是大势所趋，而这些背后本质上都依赖数据化运营，那如何根据现有业务，快速从 0 开始打造一个契合业务的数据产品呢？本文将以某二手交易平台业务为基础，讲述整个数据平台

AngelicaA 0喜欢 / 0评论 2020-06-06

MySQL主主复制+keepalived高可用方案实现

生产环境中一台MySQL主机存在单点故障，所以我们要确保MySQL的高可用性，即两台MySQL服务器如果其中有一台 MySQL 服务器挂掉后，另外一台能立马接替其进行工作。Heartbeat+DRBD 等，比较常用的是 keepalived+双主，MHA

DriveCar 0喜欢 / 0评论 2020-06-06

消息中间件(十四)-----kafka高可用以及在zookeeper中的存储

　　在Kafka在0.8以前的版本中，是没有Replication的，一旦某一个Broker宕机，则其上所有的Partition数据都不可被消费，这与Kafka数据持久性及Delivery Guarantee的设计目标相悖。同时Producer都不能再将数

那年夏天0 0喜欢 / 0评论 2020-06-04

部署一套完整的Kubernetes高可用集群（二进制，最新版v1.18）下

Kubernetes作为容器集群系统，通过健康检查+重启策略实现了Pod故障自我修复能力，通过调度算法实现将Pod分布式部署，并保持预期副本数，根据Node失效状态自动在其他Node拉起Pod，实现了应用层的高可用性。针对Kubernetes集群，高可用性

lenchio 0喜欢 / 0评论 2020-06-04

consul实现redis-sentinelHA高可用-02

但为了能够使用某条服务信息，就必须要有IP和port，当然port可以在应用中指定。check最好要有，否则当出现问题时不能从consul中注销。停止192.168.31.180 redis-server 开启 192.168.31.178 redis-

尹小鱼 0喜欢 / 0评论 2020-06-03

部署一套完整的Kubernetes高可用集群（二进制，最新版v1.18）上

Kubeadm是一个K8s部署工具，提供kubeadm init和kubeadm join，用于快速部署Kubernetes集群。从github下载发行版的二进制包，手动部署每个组件，组成Kubernetes集群。Kubeadm降低部署门槛，但屏蔽了很多细

zccheu 0喜欢 / 0评论 2020-06-01

使用Redis分布式锁实现主备

最近工作中遇到一个问题，我们会调用业务部门提供的HTTP接口获取所有的音视频任务信息，这些任务会被分发到各个机器节点进行处理。我们使用其中一台机器将任务投递到Kafka中，然后所有机器消费这些任务。需要解决投递机器单点故障的问题，最好能达到一主多备。关于K

ZHANGYONGHAO0 0喜欢 / 0评论 2020-05-31

基于 kubeadm 搭建高可用的kubernetes 1.18.2 (k8s)集群二搭建高可用集群

$ systemctl enable keepalived && service keepalived start. error execution phase control-plane-prepare/download-certs: e

CurrentJ 0喜欢 / 0评论 2020-05-28

阿里开源分布式限流框架 -Sentinel Go 0.3.0 发布，支持熔断降级能力

阿里巴巴高级开发工程师。Sentinel 是阿里巴巴开源的，面向分布式服务架构的流量控制组件，主要以流量为切入点，从限流、流量整形、熔断降级、系统自适应保护等多个维度来帮助开发者保障微服务的稳定性。近期，Sentinel Go 0.3.0 正式发布，带来了

zhangll00 0喜欢 / 0评论 2020-05-28

阿里开源分布式限流框架 - Sentinel Go 0.3.0 发布，支持熔断降级能力

枫叶上的雨露 0喜欢 / 0评论 2020-05-28

MySQL-高可用架构MHA

第1章主从复制架构演变。多活:MGR ——5.7 新特性 MySQL Group replication --->Innodb Cluster. 第2章 MHA部署流程。这里我把管理节点安装在了db03上；在实际生产中，如果没有足够的服务器，也可以

这些年来 0喜欢 / 0评论 2020-05-25

k8s高可用部署后续：SLB

前一段时间写了使用keepalived+haproxy部署k8s高可用集群，核心思想是利用keepalived生成vip实现主备容灾，以及haproxy负载k8s-apiserver流量。k8s高可用部署：keepalived + haproxy. 这种方

CurrentJ 0喜欢 / 0评论 2020-05-12

三分钟快速搭建分布式高可用的Redis集群

当单机内存、并发、流量等遇到瓶颈的时候，可以采用这种Redis Cluster方案进行解决。白嫖小贴士：CRC16是一种高质量的哈希算法，可以使每个槽所映射的键通常比较均匀。

fsl 0喜欢 / 0评论 2020-05-12

三分钟快速搭建分布式高可用的Redis集群

当单机内存、并发、流量等遇到瓶颈的时候，可以采用这种Redis Cluster方案进行解决。白嫖小贴士：CRC16是一种高质量的哈希算法，可以使每个槽所映射的键通常比较均匀。批量操作键支持有限，仅支持具有相同槽的键进行批量操作。

fansenjun 0喜欢 / 0评论 2020-05-12

实战 | Nginx+keepalived 实现高可用集群

今天通过两个实战案例，带大家理解Nginx+keepalived 如何实现高可用集群，在学习新知识之前您可以选择性复习之前的知识点：。Nginx为什么快到根本停不下来？如图所示，LB01和LB02均可轮询访问后端web节点，即表示nginx LB集群搭建成

yongzhang 0喜欢 / 0评论 2020-05-11

数据库学习之十三：mysql高可用配置

业务不间断的工作。用户的体验不出来业务断点。关闭二进制日志删除功能：relay_log_purge=0;数据库中全局关闭：set relay_log_purge=0;#涉及到安装两个软件，node和manager；ssh-keygen -t dsa -P

hanshangzhi 0喜欢 / 0评论 2020-05-10

MySQL管理之道：性能调优、高可用与监控 PDF扫描版[61MB] 完整版下载

MySQL管理之道：性能调优、高可用与监控中内容以实战为导向，所有内容均来自于笔者多年实践经验的总结和对新知识的拓展，同时也针对运维人员、DBA等相关工作者会遇到的有代表性的疑难问题给出了实用的情景模拟，并给出了解决方案。

阿亮 0喜欢 / 0评论 2020-04-29

Nginx知多少系列之(十四)Linux下.NET Core项目Nginx+Keepalived高可用（主从模式）

在这里我们简单介绍下Keepalived，它是一个基于VRRP协议来实现的服务高可用方案，可以利用其来避免IP单点故障，类似的工具还有heartbeat、corosync、pacemaker。但是它一般不会单独出现，而是与其它负载均衡技术一起工作来达到集群

houjinkai 0喜欢 / 0评论 2020-04-27

MLXY 0喜欢 / 0评论 2020-04-26

zookeeper实现namenode的高可用(HA)(第三篇)

相关推荐