首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >oozie中运行mapreduce node-action时的常见异常解决方法

oozie中运行mapreduce node-action时的常见异常解决方法

作者头像
星哥玩云
发布2022-06-29 21:16:11
发布2022-06-29 21:16:11
5200
举报
文章被收录于专栏:开源部署开源部署

在第一次使用oozie来管理mapreduce工作流时,出现了如下异常:

java.io.IOException: Type mismatch in key from map: expected org.apache.Hadoop.io.LongWritable, recieved org.apache.hadoop.io.Text

at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:872)

at org.apache.hadoop.mapred.MapTask$OldOutputCollector.collect(MapTask.java:499)以上错误,相信是大家在刚开始使用hadoop的时候都会遇到的错误,出错是因为输出格式的数据类型不匹配。

hadoopOutputCollector对象默认的存放数据的格式为<LongWritable,Text>,但在本例中,key传入的实际值为Text类型,所以会报错,现在需要设置其输出格式,改为<Text,LongWritable>类型。以前写的mapreduce是从main方法里进行驱动和运行的,在main方法里面设置了如下参数:

conf.setOutputKeyClass(Text.class);

conf.setOutputValueClass(IntWritable.class);

以上参数是设置输出格式(及key和value类型)。但在oozie中,直接配置的是map类,无法从main方法运行,所以必须指定输出格式,有如下两种方法:

1.在map类里面加入静态代码块(在类初始化的时候就会执行)

 static{   JobConf conf = new JobConf();   conf.setOutputKeyClass(Text.class);   conf.setOutputValueClass(IntWritable.class);  }

2.在oozie的workflow.xml中进行配置,参考如下:

<property>         <name>mapred.output.key.class</name>       <value>org.apache.hadoop.io.Text</value> </property> <property>         <name>mapred.output.value.class</name>         <value>org.apache.hadoop.io.IntWritable</value>  </property>

注,要在lib目录下把hadoop-core-0.20.2-cdh3u6.jar包放进去

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档