oozie中运行mapreduce node-action时的常见异常解决方法

在第一次使用oozie来管理mapreduce工作流时，出现了如下异常：

java.io.IOException: Type mismatch in key from map: expected org.apache.Hadoop.io.LongWritable, recieved org.apache.hadoop.io.Text

at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:872)

at org.apache.hadoop.mapred.MapTask$OldOutputCollector.collect(MapTask.java:499)以上错误，相信是大家在刚开始使用hadoop的时候都会遇到的错误，出错是因为输出格式的数据类型不匹配。

hadoopOutputCollector对象默认的存放数据的格式为<LongWritable,Text>，但在本例中，key传入的实际值为Text类型，所以会报错，现在需要设置其输出格式，改为<Text,LongWritable>类型。以前写的mapreduce是从main方法里进行驱动和运行的，在main方法里面设置了如下参数：

conf.setOutputKeyClass(Text.class);

conf.setOutputValueClass(IntWritable.class);

以上参数是设置输出格式（及key和value类型）。但在oozie中，直接配置的是map类，无法从main方法运行，所以必须指定输出格式，有如下两种方法：

1.在map类里面加入静态代码块（在类初始化的时候就会执行）

static{
JobConf conf = new JobConf();
conf.setOutputKeyClass(Text.class);
conf.setOutputValueClass(IntWritable.class);
}

2.在oozie的workflow.xml中进行配置，参考如下：

<property>
<name>mapred.output.key.class</name>
<value>org.apache.hadoop.io.Text</value>
</property>
<property>
<name>mapred.output.value.class</name>
<value>org.apache.hadoop.io.IntWritable</value>
</property>

注，要在lib目录下把hadoop-core-0.20.2-cdh3u6.jar包放进去

oozie中运行mapreduce node-action时的常见异常解决方法

MrTitan

相关推荐

【赵强老师】大数据工作流引擎Oozie

oozie 默认系统库位置和java代码调用oozie指定具体位置jar写法

oozie 4.0.0 on hadoop2.4.1安装笔记（完整版）

oozie CDH4和hadoop CDH4整合出现的问题(二)

oozie CDH4和hadoop CDH4整合出现的问题(一)

Oozie Java代码运行Job

Oozie运行Hive

Oozie运行Hadoop

Oozie安装部署

hadoop oozie 报错

Install oozie-3.3.2 on Hadoop 1.1.1

oozie-工作流控制节点详述

hue oozie再踩坑，workflow,coordinator终于都可以跑了

Apache Oozie v5.0.0发布，启动器调整，支持JDK8！

RedHat Linux 5.5下安装Oozie4.1.0-CDH5.5.2

Oozie-4.1.0-CDH5.5.2 安装部署

Apache Oozie 信息泄露漏洞（CVE-2017-15712）

Oozie 快速入门

高可用Hadoop平台－Oozie工作流之Hadoop调度

Oozie4.0.1详细安装教程

Hadoop平台上Oozie调度系统的安装配置

指定Oozie Java节点的Hadoop属性

oozie hive action注意事项

Hadoop Oozie学习笔记自定义安装和启动

Hadoop Oozie学习笔记 Oozie不支持Sqoop问题解决

Hadoop Oozie学习笔记 org.apache.oozie.service.Authoriz

Hadoop Oozie学习笔记E0720: Fork/join mismatch, node [join_

Hadoop生态系统搭建（hadoop hive hbase zookeeper oozie sqoop

大数据之Oozie——源码分析（一）程序入口

Oozie分布式任务的工作流——脚本篇

Oozie分布式任务的工作流——邮件篇