如何设置Hadoop HBase的Log Appender

yinbiao 2013-02-07

要想很好的监控Hadoop集群的状态，hadoop打印的log是很重要的。我们的思路是使用部门研发的log appender将hadoop的数据append到我们自己的central logging数据库中（其实就是存在hbase中）。

说起来简单，实际操作起来也花了一天多的时间，下面记录下整个过程。

首先要明确hadoop使用的log机制。hadoop使用了slf4j,log4j,apache的common-logging。slf4j是纯的log接口，common-logging和log4j既是接口也有实现。而common-logging在检查到classpath下有log4j存在时会默认用log4j吐出log，classpath里有slf4j-log4j12-xxx.jar时slf4j也通过log4j吐出log。这样hadoop的所有log都通过一个log4j.properties配置即可管理log的吐出。关系图如下：

如何设置Hadoop HBase的Log Appender

但。。。我们自己的central logging系统只有logback的appender。因此需要把这些logging的家伙都转到logback里再通过logback里的logAppender存到我们自己的log系统里。

了解了原理，我们看下如何让logback一统天下，把他们全收拾了。

如何设置Hadoop HBase的Log Appender

原理：

在classpath中加上log4j-over-slf4j jar包，这样log4j就会进入slf4j，在classpath中加入jcl-over-slf4j jar包，common-logging的log就也会进入slf4j。此时只要再加上logback的jar包，slf4j是纯接口，此时只有logback一条路可以走，这样所有的log就会乖乖的都从logback里吐出来了。下面看下实际配置的步骤：

1.创建需要lib的文件夹：

sudo mkdir /logback

2.放入我们所需的lib：

3.由于我们用的cdh系列，需要让lib目录能够让hdfs用户能访问：

sudo chmod 777 -R /logback

sudo chown -R hdfs:hdfs /logback

4.修改hadoop的启动脚本，添加我们的lib到classpath下：

sudo vim /etc/hadoop/conf/hadoop-env.sh

添加以下内容

<SPAN style="FONT-SIZE: 18px">修改classpath
LOGBACK_HOME=/logback

for i in "$LOGBACK_HOME"/*.jar; do
HADOOP_CLASSPATH="$i":"$HADOOP_CLASSPATH"
done

export HADOOP_CLASSPATH</SPAN>

: yinbiao

相关推荐

RabbitMQ如何保证消息的可靠投递？

String message = "this is info message " + i;autoAck=false: RabbitMQ会等待消费者显示回复确认消息后才从内存中移出消息。deliveryTag: 用来标识信道中投递的消息

zhuxue 0喜欢 / 0评论 2020-10-14

Linux后台执行命令：&与nohup的用法

大家可能有这样的体验：某个程序运行的时候，会产生大量的log，但实际上我们只想让它跑一下而已，log暂时不需要或者后面才有需要。所以在这样的情况下，我们希望程序能够在后台进行，也就是说，在终端上我们看不到它所打出的log。为了实现这个需求，我们介绍以下几种

zhangbingb 0喜欢 / 0评论 2020-09-21

Linux 入侵痕迹清理技巧

本文转载自微信公众号「 Bypass」，作者 Bypass 。在攻击结束后，如何不留痕迹的清除日志和操作记录，以掩盖入侵踪迹，这其实是一个细致的技术活。你所做的每一个操作，都要被抹掉;你所上传的工具，都应该被安全地删掉。编辑history记录文件，删除部分

HeronLinuxampARM 0喜欢 / 0评论 2020-09-14

为什么排序的复杂度为O(N log N)

基本上所有正而八经的算法教材都会解释像快速排序quicksort和堆排序heapsort这样的排序算法有多快，但并不需要复杂的数学就能证明你可以逐渐趋近的速度有多快。大多数计算机专业的科学家使用大写字母 O 标记来指代“趋近，直到到达一个常数比例因子”，这

美丽的泡沫 0喜欢 / 0评论 2020-09-08

Filebeat简介

Filebeat附带预构建的模块，这些模块包含收集、解析、充实和可视化各种日志文件格式数据所需的配置，每个Filebeat模块由一个或多个文件集组成，这些文件集包含摄取节点管道、Elasticsearch模板、Filebeat勘探者配置和Kibana仪表盘

goodstudy 0喜欢 / 0评论 2020-08-19

JS中DOM元素的操作

<button id="btn" class="btnlist" name="btn_n">点我一下</button>. innerHTML语法: ele.innerHTM

luvhl 0喜欢 / 0评论 2020-08-17

javascript解析json格式的数据方法详解

JSON 是一种简单的数据格式，比xml更轻巧。它是 JavaScript 原生格式，这意味着在 JavaScript 中处理 JSON 数据不需要任何特殊的 API 或工具包。那么如何用JavaScript来解析json呢？var o={“key”:”v

littleFatty 0喜欢 / 0评论 2020-08-16

MySQL是如何保证数据的完整性

数据的一致性和完整性对于在线业务的重要性不言而喻，如何保证数据不丢呢？今天我们就探讨下关于数据的完整性和强一致性，MySQL做了哪些改进。在Oracle和MySQL这种关系型数据库中，讲究日志先行策略,只要日志持久化到磁盘，就能保证MySQL异常重启后，数

gamestart0 0喜欢 / 0评论 2020-08-15

mysql解决时区相关问题

在使用 MySQL 的过程中，你可能会遇到时区相关问题，比如说时间显示错误、时区不是东八区、程序取得的时间和数据库存储的时间不一致等等问题。其实，这些问题都与数据库时区设置有关，本篇文章将从数据库参数入手，逐步介绍时区相关内容。log_timestamps

URML 0喜欢 / 0评论 2020-08-15

如何在JavaScript实现休眠或等待功能，实现sleep函数

JavaScript不具有 sleep() 函数，该函数会导致代码在恢复执行之前等待指定的时间段。JavaScript中没有 sleep() 方法，所以你可以尝试使用下一个最好的方法 setTimeout()。不幸的是，setTimeout() 不能像你

sfkong 0喜欢 / 0评论 2020-08-02

debian apach2 wsgi 自定义log logrotate 之后无权限访问

今天测试发现web打不开了，看下error.log发现是自定义log属主变成了root adm，apache2无法访问，后来搜索发现，apache2的日志由logrotate定期压缩备份清理，看了下/etc/logrotate.d/apache2 的配置有

82941732 0喜欢 / 0评论 2020-07-27

es6 Promise 对象、.then()

// resolve // 状态改成fulfilled. },=>{ // 第二个回调成功reject

whynotgonow 0喜欢 / 0评论 2020-07-26

filebeat配置文件

#input设置，支持Docker,Container,HTTP JSON,Log,Kafka,MQTT,NetFlow,Redis,TCP,DCP,Syslog,Stdin. #output设置，可以output到kafka,logstash,elast

偏头痛杨 0喜欢 / 0评论 2020-07-18

mysql的日志模块

连接器-------->分析器------->优化器--------->执行器-------->存储引擎 #如下图。一家商店有一个记账板，当赊账顾客多的时候，会临时记录在记账板上，避免频繁去记账本上查找更新对应顾客的信息。避免高峰

timewind 0喜欢 / 0评论 2020-07-04

Golang保存PostgreSQL数据至结构

db, err := sql.Open("postgres", "user=admin password=123456 dbname=test sslmode=disable"). if err != nil {.

89407707 0喜欢 / 0评论 2020-06-27

封装excel数据层代码，log模块导入

封装excel操作代码，提高复用率。整体封装思想阐述：。表内用例格式构建。首先获取表体第一行的数据组成的列表。之后逐条将表头与数据zip封包，之后转换为字典。从excel中读取的数据，除了数值，其他不管保存的时候什么格式，读取出来都是str. 解决该问参考

xiaoxiaoCNDS 0喜欢 / 0评论 2020-06-26

TypeScript（13）：元组

我们知道数组中元素的数据类型都一般是相同的，如果存储的元素数据类型不同，则需要使用元组。元组中元素使用索引来访问，第一个元素的索引值为 0，第二个为 1，以此类推第 n 个为 n-1，语法格式如下:. console.log // 返回元组的大小。m

lyjava 0喜欢 / 0评论 2020-06-26

TypeScript（06）：运算符

运算符用于执行程序代码运算，会针对一个以上操作数项目来进行运算。以上实例中 7、5 和 12 是操作数。关系运算符用于计算结果是否为 true 或者 false。逻辑运算符用于测定变量或值之间的逻辑。

ChaITSimpleLove 0喜欢 / 0评论 2020-06-25

nginx 日志切割

nginx 日志一般都是两种access.log error.log ，可以每个location 区域配置一份，也就是每个请求服务一个日志。它的日志不会自动切割，需要人为根据时间或者日志量切割。　　LOG_PATH=/opt/nginx/logs 　

Strongding 0喜欢 / 0评论 2020-06-25

CentOS 7 如何清空文件内容

方法1、在非编辑状态下使用快捷键gg跳至首行头部，再使用dG即可。方法2、cat /dev/null > /var/log/yum.log

Aveiox 0喜欢 / 0评论 2020-06-23

前端性能监控-window.performance.timing篇

最近发现浏览器内置对象里有个好东西，window.performance。这里面包含着浏览器性能相关的各种数据，然后其中的timing属性，就是所有阶段的用时统计，从这一点我们就可以简单的从浏览器运行时间上进行分析。通过这种时间分析则可以看出当前页面的时间

xxuncle 0喜欢 / 0评论 2020-06-14

自从知道了这几个 JavaScript 技巧，下班都变早了！

谁要是说 JavaScript 是世界上比较好的语言，估计会被唾沫星子淹没。但是如果说 JavaScript 是世界上应用很广泛的编程语言，估计大部分人都没意见。尤其是有了 NodeJS 之后，JavaScript 更是无孔不入。Atwood 定律：“任

佐杰 0喜欢 / 0评论 2020-06-14

MYSQL中binlog优化的一些思考汇总

WAL是实现事务持久性的一个常用技术，基本原理是将事务的修改记录redo log。redo log顺序追加写入。事务提交时，只需要保证事务的redo log落盘即可，通过redo log的顺序写代替页面的随机写提升数据库系统的性能。但是，该方案必须要求每个

smartleizi 0喜欢 / 0评论 2020-06-14

每天前端学习关于Promise和Symbol

若要等待多个结果回来，再进行返回，则可以使用 Promise.all. console.log //[‘成功了‘, ‘success‘]. ES6新增一个数据类型 Symbol ,但不支持 new Symbol，可以返回唯一值

88520191 0喜欢 / 0评论 2020-06-13

mogodb 可随意复制的简单配置

quiet = truedbpath = data\dblogpath = log\mongo.loglogappend = trueport = 27017. 另外.当需要以服务方式安装时,需将mongod.conf 中的路径改为绝对路径,可以用命令mo

fangxiaoji 0喜欢 / 0评论 2020-06-13

shell脚本在后台运行以及日志重定向输出

Linux默认定义两个变量：1和2；其中 cmd > out.log & 和 cmd 1 > out.log & 是一样的，如果想忽略某个输入，则输出到 /dev/null 设备即可。但是这种后台xshell窗口在退出ssh登录

lishaokang 0喜欢 / 0评论 2020-06-12

对nginx反向代理日志json格式化

sudo nginx -t?sudo nginx -s reload

小木兮子 0喜欢 / 0评论 2020-06-12

【转】Linux中常用的tar解压打包命令语法介绍

常用的tar解压打包命令语法介绍1．命令格式2．命令功能3．命令参数4．常见解压/压缩命令5．使用实例1．命令格式tar[必要参数][选择参数][文件]. .tar.gz 和 .tgz解压：tar zxvf FileName.tar.gz压缩：tar zc

wintelx 0喜欢 / 0评论 2020-06-11

超强干货！通过filebeat、logstash、rsyslog 几种方式采集 nginx 日志

由于nginx功能强大，性能突出，越来越多的web应用采用nginx作为http和反向代理的web服务器。而nginx的访问日志不管是做用户行为分析还是安全分析都是非常重要的数据源之一。如何有效便捷的采集nginx的日志进行有效的分析成为大家关注的问题。本

wangfengqingyang 0喜欢 / 0评论 2020-06-11

MySQL日志管理

事务日志的写入类型为“追加”，因此其操作为“顺序IO”；通常也被称为：预写式日志 write ahead logging. 如果发现数据库特别慢，可以修改这个flush这个值，从1修改为2.1 此为默认值，日志缓冲区将写入日志文件，并在每次事务后执行刷新到

林大鹏 0喜欢 / 0评论 2020-06-10

Git——详细使用

但是 git mv命令直接免执行了修改和add 这才是git中正规的修改文件名字的方法 git mv之后直接执行git commit 不再git add）。git log 查看git日志 git log 只针对当前的分支信息查看所有的

keepdoingit 0喜欢 / 0评论 2020-06-08

Kafka源码解析（一）---LogSegment以及Log初始化

我们先回想一下Kafka的日志结构是怎样的？Kafka 日志对象由多个日志段对象组成，而每个日志段对象会在磁盘上创建一组文件，包括消息日志文件、位移索引文件、时间戳索引文件以及已中止事务的索引文件。当然，如果你没有使用 Kafka 事务，已中止事务的索引文

jiaomrswang 0喜欢 / 0评论 2020-06-07

.netCore微服务使用Nginx集中式管理实现

#log_format main ‘$remote_addr - $remote_user [$time_local] "$request" ‘。# redirect server error pages to the static

咻咻ing 0喜欢 / 0评论 2020-06-07

[SQL Server]内存缓存数据写入磁盘(三)延迟持久性Delayed Durability(和魔鬼交易)

前面我们曾讨论到，SQL Server为了确保完整性及持久性，一个事务的Commit完成，是将写入Buffer Pool中的”Log” Flush到Disk上才算完成，也就是write-ahead log 。测试Delayed Durability会分别以

bluet00 0喜欢 / 0评论 2020-06-05

ansible分发日志清理脚本

#find $TarlogPath -type f -mtime -5 -exec tar -zcfP backup$currTime_.tar.gz "{}" \;find $TarlogPath -type f -mtime -

awoyaoc 0喜欢 / 0评论 2020-06-05

django 日志

‘format‘: ‘%s FuncName:%s LINE:%d [%s]- %s‘。‘formatter‘: ‘standard‘,‘handlers‘: [‘console‘, ‘default_debug‘],‘handlers‘: [‘reque

GreatZhou 0喜欢 / 0评论 2020-06-04

用jmeter编写脚本做实时线上监控

## 判断xml日志文件是否存在，不存在,lb=`cat $log/mtl_pc.xml |xml2|grep "@lb"|awk -F "=" ‘{print $2}‘|tail -1`. failureMessa

新路 0喜欢 / 0评论 2020-06-03

MySQL5.7配置GTID双主

grant replication slave on *.* to ‘ops‘@‘192.168.10.%‘ identified by ‘ops123‘;mysqldump -uroot -p --single-transaction --default

wanjichun 0喜欢 / 0评论 2020-06-02

git执行版本回退的步骤及注意点

方法1： git reset –hard HEAD ^ ( ^ 表示回到上一个版本，如果需要回退到上上个版本的话，将HEAD^改成HEAD^^, 以此类推。找回本地仓库里边最近add的60个文件。

loganwz 0喜欢 / 0评论 2020-06-02

10.Nginx配置文件与日志切割

一般，每个区块以一对大括号{}来表示开始与结束。worker_processes auto; # auto 一般以你cpu核心数决定多少，也可以自定义。###############################

SZStudy 0喜欢 / 0评论 2020-06-01

日志级别

log4j定义了8个级别的log，优先级从高到低依次为：OFF、FATAL、ERROR、WARN、INFO、DEBUG、TRACE、 ALL。TRACE：designates finer-grained informational events than

sdaq 0喜欢 / 0评论 2020-05-30

Redis数据库

Redis是一种基于键值对的NoSQL数据库,与很多键值对数据库不同,redis中的值可以有string,hash,list,set,zset,geo等多种数据结构和算法组成.因为Redis会将所有的数据都放在内存中,所以他的读写性能非常惊人.Redis还

大脸猫脸大 0喜欢 / 0评论 2020-05-30

MySQL-MyCAT分布式架构

[ ~]# mysqld --initialize-insecure --user=mysql --datadir=/data/3307/data --basedir=/application/mysql. [ ~]# mysqld --initiali

vivenwan 0喜欢 / 0评论 2020-05-30

MySQL中的日志

　　7：中继日志。其中重做日志和回滚日志与事务操作息息相关，二进制日志也与事务操作有一定的关系，这三种日志，对理解MySQL中的事务操作有着重要的意义。　　确保事务的持久性。redo日志记录事务执行后的状态，用来恢复未写入data file的已成功事务更新

阿亮 0喜欢 / 0评论 2020-05-30

11个步骤完美排查Linux机器是否已经被入侵

随着开源产品的越来越盛行，作为一个Linux运维工程师，能够清晰地鉴别异常机器是否已经被入侵了显得至关重要，个人结合自己的工作经历，整理了几种常见的机器被黑情况供参考。背景信息：以下情况是在CentOS 6.9的系统中查看的，其它Linux发行版类似。可以

archimedes 0喜欢 / 0评论 2020-05-27

ES6 Promise 对象

es6 Promise 对象是异步编程的一种解决方案。从语法上说，Promise 是一个对象，从它可以获取异步操作的消息。Promise 异步操作有三种状态：pending（进行中）、fulfilled（已成功）和 rejected（已失败）。只要处于 f

Magicsoftware 0喜欢 / 0评论 2020-05-26

Linux下如何快速删除海量文件

日常运维中，某些服务器几十万的文件需要删除，该如果快速删除？[ test]$ for i in $.log;do echo "this is test">>${i}.log;done

zhangwentaohh 0喜欢 / 0评论 2020-05-25

MySQL慢查询

yum install -y perl perl-DBI perl-DBD-MySQL perl-ExtUtils-CBuilder perl-ExtUtils-MakeMaker. mysqlsla -lt slow --sort t_sum --t

唐文 0喜欢 / 0评论 2020-05-25

windows安装使用mongodb

设置数据库路径和日志路径，分别从bin目录进入cmd dos命令界面执行下面命令，文件路径提前要建好：。然后关闭所有mogodb的dos命令，不关闭的话会被占用无法启动，然后启动服务就好了。然后开始项目测试。

wangxingg 0喜欢 / 0评论 2020-05-20

Centos下安装MongoDB4.2.3

bindIp: 0.0.0.0 # Enter 0.0.0.0,:: to bind to all IPv4 and IPv6 addresses or, alternatively, use the net.bindIpAll setting.# Re

sunnnyduan 0喜欢 / 0评论 2020-05-17