ZooKeeper-- 管理分布式环境中的数据

1.随着分布式应用的不断深入，需要对集群管理逐步透明化。监控集群和作业状态；可以充分的利用ZK的独有特性，熟悉程度决定应用高度

2.Service端具有fast fail特性，非常健壮，无单点，不超过半数Server挂掉不会影响提供服务

3.zookeeper名字空间由节点znode构成，其组织方式类似于文件系统，其各个节点相当于目录和文件，通过路径作为唯一标示。与文件系统不同的是，每个节点具有与之对用的数据内容，同时也可以具有子节点

4.ZK用于存储协调数据，如状态、配置、位置信息等。每个节点存储的数据量很小KB级别

5.节点维护一个状态stat结构（包括数据变化的版本号、ACL变化、时间戳），以允许缓存验证与协调更新。每当节点数据内容改变，多一个版本号类似Hbase。客户端获取数据的同时也会获取数据版本号，节点的数据内容以原子方式读写。节点具有一个访问控制列表来约束访问操作，即具有权限控制

6.Watches:
Zk对Node的CRUD都可以触发监听
watch事件是一次性触发器，当wacht监视的数据发生变化，通知设置了该watch的clietn，即wacther

watch事件是异步发送至观察者

wacth是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟，所以有可能不能可靠的观察到节点的每一次变化

客户端监视一个节点，总是先获取watch事件再发现节点的数据变化

watch事件的顺序对应于ZK服务所见的数据更新的顺序

7.ZK在hadoop平台上的典型应用

storm集群：Zk作为nimbus(master)和supervisor(slave)的中间枢纽，保存strom集群和作业的所有信息。并负责nimbus和supervisor的全部通信
Hbase集群：Zk作为协调器，为hbase提供了稳定服务和failover机制，HRegionServer也会把自己以Ephemeral（临时节点）方式注入到ZK中，使得Hmaster可以随时感知到各个HRegionServer的健康状态（可用于监控RegionServer）此外Zk也避免了HMaster的单点问题

应用三大块：
strom应用开发，storm集群监控
MR应用开发
HBase应用开发

8.流行的场景应用：
分布式配置管理：
分布式订阅即所谓的配置管理，顾名思义就是将数据发布到ZK节点上，共订阅者动态的获取数据，实现配置信息的集中式管理和动态更新，例如全局的配置信息，地址列表等就非常适合使用

NameService
这个主要是作为分布式命名的服务，通过调用Zk的create node api，能够很容易的创建一个全局唯一的path，这个path就可以作为一个名称

分布式通知/协调
Zk中特有的watcher注册与异步通知机制，能够很好的实现分布式环境下不同系统之间的通知于协调，实现对数据变更的实时处理。
使用方法通常是不同系统都对ZK上同一个znode进行watch，监听znode的变化（包括znode本身内容及子节点）其中一个系统update了znode那么另一个系统能够收到通知，并作出相应处理

分布式锁
这个主要得益于ZK为我们保证了数据的强一致性，即用户只要相信每时每刻，ZK集群中任意节点上的相同znode的数据时一定相同的。锁服务可以分为两大类：1.保持独占 2.控制时序

Hbase Master选举是ZK经典使用场景

Znode

Znode Znode维护着数据、ACL（access control list，访问控制列表）、时间戳等交换版本号等数据结构，它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加，这非常类似于数据库中计数器时间戳的操作方式。

另外Znode还具有原子性操作的特点：命名空间中，每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据，写操作将替换掉所有的数据。除此之外，每一个节点都有一个访问控制列表，这个访问控制列表规定了用户操作的权限。

ZooKeeper中同样存在临时节点。这些节点与session同时存在，当session生命周期结束，这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用

Watch机制

Watch机制就和单词本身的意思一样，看。看什么？具体来讲就是某一个或者一些Znode的变化。官方给出的定义：一个Watch事件是一个一次性的触发器，当被设置了Watch的数据发生了改变的时候，则服务器将这个改变发送给设置了Watch的客户端，以便通知它们。

Watch机制主要有以下三个特点：

1 一次性的触发器（one-time trigger）

当数据改变的时候，那么一个Watch事件会产生并且被发送到客户端中。但是客户端只会收到一次这样的通知，如果以后这个数据再次发生改变的时候，之前设置Watch的客户端将不会再次收到改变的通知，因为Watch机制规定了它是一个一次性的触发器。

2 发送给客户端

这个表明了Watch的通知事件是从服务器发送给客户端的，是异步的，这就表明不同的客户端收到的Watch的时间可能不同，但是ZooKeeper有保证：当一个客户端在看到Watch事件之前是不会看到结点数据的变化的。例如：A=3，此时在上面设置了一次Watch，如果A突然变成4了，那么客户端会先收到Watch事件的通知，然后才会看到A=4。

3被设置Watch的数据

这表明了一个结点可以变换的不同方式。一个Znode变化方式有两种，结点本身数据的变化以及结点孩子的变化。因此Watch也可以设置为这个Znode的结点数据，当然也可以设置为Znode结点孩子。

使用API来访问ZooKeeper

API访问ZooKeeper才是客户端主要的使用手段，通过在客户端编写丰富多彩的程序，来达到对ZooKeeper的利用。这里给出一个简单的例子：（深入的还没能力给出啊，例子是从网上找的很清晰明了）

1. import java.io.IOException;
2.
3. import org.apache.zookeeper.CreateMode;
4. import org.apache.zookeeper.KeeperException;
5. import org.apache.zookeeper.Watcher;
6. import org.apache.zookeeper.ZooDefs.Ids;
7. import org.apache.zookeeper.ZooKeeper;
8.
9. public class demo {
10.     // 会话超时时间，设置为与系统默认时间一致
11.     private static final int SESSION_TIMEOUT=30000;
12.    
13.     // 创建 ZooKeeper 实例
14.     ZooKeeper zk;
15.    
16.     // 创建 Watcher 实例
17.     Watcher wh=new Watcher(){
18.            public void process(org.apache.zookeeper.WatchedEvent event)
19.            {
20.                    System.out.println(event.toString());
21.            }
22.     };
23.    
24.     // 初始化 ZooKeeper 实例
25.     private void createZKInstance() throws IOException
26.     {             
27.            zk=new ZooKeeper("localhost:2181",demo.SESSION_TIMEOUT,this.wh);
28.           
29.     }
30.    
31.     private void ZKOperations() throws IOException,InterruptedException,KeeperException
32.     {
33.            System.out.println("\n1. 创建 ZooKeeper 节点 (znode ： zoo2, 数据： myData2 ，权限： OPEN_ACL_UNSAFE ，节点类型： Persistent");
34.            zk.create("/zoo2","myData2".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
35.           
36.            System.out.println("\n2. 查看是否创建成功： ");
37.            System.out.println(new String(zk.getData("/zoo2",false,null)));
38.                           
39.            System.out.println("\n3. 修改节点数据 ");
40.            zk.setData("/zoo2", "shenlan211314".getBytes(), -1);
41.           
42.            System.out.println("\n4. 查看是否修改成功： ");
43.            System.out.println(new String(zk.getData("/zoo2", false, null)));
44.                           
45.            System.out.println("\n5. 删除节点 ");
46.            zk.delete("/zoo2", -1);
47.           
48.            System.out.println("\n6. 查看节点是否被删除： ");
49.            System.out.println(" 节点状态： ["+zk.exists("/zoo2", false)+"]");
50.     }
51.    
52.     private void ZKClose() throws  InterruptedException
53.     {
54.            zk.close();
55.     }
56.    
57.     public static void main(String[] args) throws IOException,InterruptedException,KeeperException {
58.            demo dm=new demo();
59.            dm.createZKInstance( );
60.            dm.ZKOperations();
61.            dm.ZKClose();
62.     }
63.}

此类包含两个主要的 ZooKeeper 函数，分别为 createZKInstance （）和 ZKOperations （）。其中 createZKInstance （）函数负责对 ZooKeeper 实例 zk 进行初始化。 ZooKeeper 类有两个构造函数，我们这里使用 “ ZooKeeper （ String connectString, ， int sessionTimeout, ， Watcher watcher ）”对其进行初始化。因此，我们需要提供初始化所需的，连接字符串信息，会话超时时间，以及一个 watcher 实例。 17 行到 23 行代码，是程序所构造的一个 watcher 实例，它能够输出所发生的事件。

ZKOperations （）函数是我们所定义的对节点的一系列操作。它包括：创建 ZooKeeper 节点（ 33 行到 34 行代码）、查看节点（ 36 行到 37 行代码）、修改节点数据（ 39 行到 40 行代码）、查看修改后节点数据（ 42 行到 43 行代码）、删除节点（ 45 行到 46 行代码）、查看节点是否存在（ 48 行到 49 行代码）。另外，需要注意的是：在创建节点的时候，需要提供节点的名称、数据、权限以及节点类型。此外，使用 exists 函数时，如果节点不存在将返回一

个 null 值。

ZooKeeper-- 管理分布式环境中的数据

相关推荐