Hadoop2.0 HA的主备自动切换

1 准备

假定已经有一个zookeeper的集群，3台机器如下：

zookeeper1
zookeeper2
zookeeper3

两个namenode节点如下：

namenode1

namenode2

2 配置

只涉及到core-site.xml和hdfs-site.xml两个配置文件，其他配置可以文件参考《hadoop2.0的安装和基本配置》一文。

2.1 core-site.xml

需要增加ha.zookeeper.quorum参数，加上zookeeper的服务地址

完整配置如下：

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/tmp/hadoop2.0</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>zookeeper1:2181,zookeeper2:2181,zookeeper3:2181</value>

</property>

</configuration>

2.2 hdfs-site.xml

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

</property>

<name>dfs.datanode.data.dir</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.nameservices</name>

<value>mycluster</value>

</property>

<name>dfs.ha.namenodes.mycluster</name>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name>

<value>namenode1:8020</value>

</property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>

<value>namenode2:8020</value>

</property>

<name>dfs.namenode.http-address.mycluster.nn1</name>

<value>namenode1:50070</value>

</property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

<value>namenode2:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://journalnode1:8485;journalnode2:8485;journalnode3:8485/mycluster</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/dfs/journal</value>

</property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>shell(/bin/true)</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

</configuration>

dfs.ha.automatic-failover.enabled

需要设置为true，启动自动切换。

dfs.ha.fencing.methods

这里我们把fencing方法设置为shell，一是为了方便测试，二是采用QJM方式的HA本身就有fencing功能，不需要用这个参数中的fencing功能，详解请参考《hadoop2.0 QJM方式的HA的配置》一文。你用sshfence的方法也是可以的，不过要注意ssh连接的问题和一些权限的问题。

3 在zookeeper中初始化

$HADOOP_HOME/bin/hdfs zkfc -formatZK

运行这个命令后，会在zookeeper上创建一个/hadoop-ha/mycluster/的znode，用来存放automatic failover的数据。

4 启动zkfc(zookeeper failover controller)

需要在namenode1和namenode2上都启动zkfc daemon进程。

$HADOOP_HOME/sbin/hadoop-daemon.sh start zkfc

5 启动HDFS

在两个namenode都启动之后，会发现，其中一个namenode会自动切换成active状态，不需要手工切换。

Hadoop2.0 HA的主备自动切换

相关推荐