朝花amp夕拾 2011-03-04
为了监控Hadoop集群,为集群装了ganglia,一直用的好好的。但是过年回来以后,发现有一台机器的gmond进程死活起不来,检查系统日志,错误如下:
udp_recv_channelmcast_join=239.2.11.73mcast_if=NULLport=8649bind=239.2.11.73
Errorcreatingmulticastservermcast_join=239.2.11.73port=8649mcast_if=NULLfamily='inet4'.Exiting.
google百度了一番,没有结果,郁闷
考虑到gmond默认的都是通过组播的形式进行数据传输的,既然组播不行,那就试试单播模式吧
修改gmond.conf配置如下:
将
udp_send_channel{
mcast_join=239.2.11.72
port=8649
ttl=1
}
修改为:
udp_send_channel{
host=hadoop1
port=8649
}
这样所有的服务器就将数据都发往hadoop1这台机器了
然后在gmetad.conf中,配置
data_source"hadoop"hadoop1:8649
这样就可以从Hadoop1中获取到信息了~~
重启所有的gmond和gmetad,服务正常了
备注:
还发现一个问题,hadoop1的gmond需要在其他机器起来之前启动,否则无法获取其他机器的配置信息。