idlerbm 2016-03-27
此篇的目的是怎么检错以及原理
192.168.159.31(node1) Namenode
192.168.159.32(node2) zookeeper Datanode JN(JournalNode)
192.168.159.33(node3) zookeeper Datanode JN
192.168.159.34(node4) zookeeper Datanode JN
192.168.159.35(node5) Namenode
如上图:
namenode之间需要保持一样的元数据,包括fsimage和edits,edits文件会从active的namenode直接写在JN上
在node1上 start-dfs.sh后 若哪个节点没有启动
这个时候最直接的检错方法是查看日志
日志在hadoop/logs日志目录中,哪个节点出错了,就去哪个节点上查看相对应的日志即可
比如:杀死node1后,node5的状态还是standby,此时就需要在node5上查看
tail -100 hadoop-root-zkfc-node5.log 里面会详细的记录为什么zookeeper没有选举node5位active