通过 JMX 获取Hadoop/HBase监控数据

概述

说到对Hadoop和 HBase的集群监控，大家知道的和用的最多的可能还是第三方的监控工具，cacti，ganglia，zabbix之类的。玩的深一些的，会用 zenoss之类的。这些工具确实不错，也能发挥很大的作用，但时间长了总感觉监控粒度还是比较粗，不够详细。毕竟是第三方的监控，即便Hadoop自带了ganglia的接口，也还是觉得不够。

其实Hadoop本身是带有监控接口的，各公司的发行版还有自己定制的接口，不过可能知道的人就不太多了。

其实这个接口特别简单，但是非常详细，也非常方便，就是JMX。

Hadoop的http监控端口基本所有人都知道，namenode 50070，jobtracker 50030，datanode 50075，tasktracker 50060。不过当用户访问这些端口的时候，会自动跳转到dfshealth.jsp或者jobtracker.jsp这样的监控页面。jmx的访问很简单，只需要把网页的名字换成jmx就可以了。

例如，将

http://your_namenode:50070/dfshealth.jsp的地址替换成http://your_namenode:50070/jmx

即可，其他如50030，50060等等，也依次类推，HBase的系统信息也可以用这种方法获取。

返回值全部是JSON，非常便于自己进行处理。返回的信息也非常详细，内存状态，内存池状态，java堆信息等等。甚至还有操作系统信息，版本，JVM版本信息等等，很全面。

实现

对于http://your_namenode:50070/jmx 这样地址的数据访问可以通过HttpClient进行数据访问，再将得到的数据通过

由于返回的Json数据量很大，而且基本上不可能全部需要，对于这种情况可以通过添加?qry方式获得部分数据，

例如http://your_namenode:60010/jmx?qry=Hadoop:service=HBase,name=Master,sub=Server

Maven配置：

<groupId>commons-httpclient</groupId>

<artifactId>commons-httpclient</artifactId>

</dependency>

</dependency>

Java类

该程序以获得Hbase的监控数据为例，关于HDFS的监控数据相似

/**
* 作为HBase Master监控信息的source
*
* @author aihua.sun
* @date 2015/4/6
* @since V1.0
*/

import com.eric.agent.flume.model.HMasterRoleInfo;
import com.eric.agent.utils.AgentConstants;
import com.eric.agent.utils.MetricDataUtils;
import org.json.JSONException;
import org.json.JSONObject;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class HBaseMasterDataProvider{
protected final Logger LOGGER = LoggerFactory.getLogger(getClass());
private static final String server = "Hadoop:service=HBase,name=Master,sub=Server";
private static final String assignment = "Hadoop:service=HBase,name=Master,sub=AssignmentManger";

@Override
public String extractMonitorData() {
//TODO 通过调用API获得IP以及参数
HMasterRoleInfo monitorDataPoint = new HMasterRoleInfo();
String URL = "http://hostname:60010/jmx";

JSONObject serverJson = qryJSonObjectFromJMX(URL, server);
JSONObject assignJson = qryJSonObjectFromJMX(URL, assignment);

try {
monitorDataPoint.setNumRegionServers(serverJson.getLong("numRegionServers"));
monitorDataPoint.setNumDeadRegionServers(serverJson.getLong("numDeadRegionServers"));
monitorDataPoint.setClusterRequests(serverJson.getLong("clusterRequests"));
monitorDataPoint.setRitCount(assignJson.getLong("ritCount"));
monitorDataPoint.setRitCountOverThreshold(assignJson.getLong("ritCountOverThreshold"));
monitorDataPoint.setRitOldestAge(assignJson.getLong("ritOldestAge"));

} catch (JSONException e) {
e.printStackTrace();
}
return monitorDataPoint.toString();
}

public static void main(String[] args){
System.out.println(new HBaseMasterDataProvider().extractMonitorData());
}

/**

* 通过jmx获取监控数据

* @param URL

* @param objectName

* @return

public static JSONObject qryJSonObjectFromJMX(String URL, String objectName) {

JSONObject jsonObject = null;

try {

StringBuilder sb = new StringBuilder(URL);

sb.append("?qry=");

sb.append(objectName);

GetMethod getMethod = new GetMethod(sb.toString());

int statusCode = httpClient.executeMethod(getMethod);

String jsonStr = new String(getMethod.getResponseBody());

jsonObject = new JSONObject(removeDuplicateContext(jsonStr)).getJSONArray("beans").getJSONObject(0);

} catch (JSONException e) {

e.printStackTrace();

} catch (Exception e) {

e.printStackTrace();

}

return jsonObject;

}
}

参考文章

JMXJsonServlet 介绍
http://hbase.apache.org/apidocs/org/apache/hadoop/hbase/http/jmx/JMXJsonServlet.html
Hadoop指标介绍
http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/Metrics.html#rpc

--------------------------------------分割线 --------------------------------------

搭建Hadoop环境（在Winodws环境下用虚拟机虚拟两个Ubuntu系

通过 JMX 获取Hadoop/HBase监控数据

NeboFeng

相关推荐

Java命令行监控_jvisualvm使用JMX连接远程机器（实践）

jmeter脚本文件（jmx）关联

zabbix监控通过jmx监控tomcat的配置过程

Jmeter执行流程分析

中间件安全基线配置

JMeter测试工具.jmx文件详解

Jconsole与Jmx 分析JVM状况（上）转

JConsole的使用手册监控运行的JVM

使用visualvm监控tomcat

JMX 远程监控 JBoos/Tomcat

基于Spring支持JMX

activemq 用jmx监控时的security配置

mule jmx远程监控

web容器中用jmx监控hibernate sessionFactory

Apache Mina 文档翻译 - 第十六章 - JMX支持

使用Prometheus+Grafana监控JVM

利用VisualVm和JMX远程监控K8S里的Java进程

利用VisualVm和JMX远程监控Java进程

Hadoop JMX

linux下利用JMX监控Tomcat

从JMX 谈系统监控

使用JMX开发组件体系结构

Tomcat源码系列8--Tomcat的JMX管理2

tomcat 7 源码分析-7 server初始化中的JMX(DynamicMBean)再续

tomcat 7 源码分析-6 server初始化中的JMX(DynamicMBean)续

tomcat 7 源码分析-5 server初始化中的JMX(DynamicMBean)

james 3.0-M2 下的 JMX

Spring JMX的总结学习（二）注解实现MBean

activemq的jmx监控以及死消息的处理

ActiveMQ5.10.2版本配置JMX

Zabbix通过JMX监控Tomcat——防火墙策略问题分析

JMX远程监控JVM

使用JMX监控Kafka

Oracle Java SE JMX子组件远程JRE漏洞(CVE-2013-1486)

JBoss Enterprise Application Platform JMX Console XSS漏洞

Hadoop和HBase集群的JMX监控

基于JMX监控下的JBoss数据库连接池