Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >java -jar运行MR程序

java -jar运行MR程序

作者头像
sparkle123
发布于 2018-07-04 03:05:02
发布于 2018-07-04 03:05:02
1.4K00
代码可运行
举报
运行总次数:0
代码可运行

1、一般的做法都是使用hadoop jar的形式提交任务。 vi bin/hadoop.jar

image.png

其实内部调用了RunJar.java 用来读取hadoop环境参数,配置文件等

2、现在想用单纯的java -jar来提交MR任务到yarn也是可行的

3、打个胖包。

image.png

4、java -jar wc-fat.jar /day08-wc/input/wc.txt /day08-wc/output3 报错:

image.png

胖包里面没有配置文件。 把输入输出文件当成local模式的了。

5、下载集群的配置文件到本地Eclipse src目录下。

image.png

6、指定本程序的jar包所在的本地路径

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
//job.setJarByClass(WordcountDriver.class);
   job.setJar("/home/hadoop/lib/wc-fat.jar");

再次执行即可: java -jar wc-fat.jar /day08-wc/input/wc.txt /day08-wc/output4

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
MapReduce集群运行模式详细步骤(小白也看的懂的步骤)
hadoop jar original-mapreduce-1.0-SNAPSHOT.jar com.czxy.Test01.WordCountDriver (这个jar后面就是你 Copy的 Reference)
刘浩的BigDataPath
2021/04/13
3690
MapReduce集群运行模式详细步骤(小白也看的懂的步骤)
大数据技术之_05_Hadoop学习_01_MapReduce_MapReduce概述+Hadoop序列化
  采用反编译工具【jd-gui.exe】反编译源码,发现WordCount案例有Map类、Reduce类和驱动类。且数据的类型是Hadoop自身封装的序列化类型。
黑泽君
2019/03/04
6020
大数据技术之_05_Hadoop学习_01_MapReduce_MapReduce概述+Hadoop序列化
Hadoop学习:深入解析MapReduce的大数据魔力之数据压缩(四)
压缩方式选择时重点考虑:压缩/解压缩速度、压缩率(压缩后存储大小)、压缩后是否 可以支持切片。
老虎也淘气
2024/01/30
2310
Hadoop学习:深入解析MapReduce的大数据魔力之数据压缩(四)
MapReduce之Eclipse本地运行
  前面我们介绍的wordcount案例是在Eclipse中写好代码,然后打成jar包,然后在Linux环境中执行的,这种方式在我们学习和调试的时候就显得非常的不方便,所以我们来介绍下直接在Eclipse运行的本地运行方式。
用户4919348
2019/04/17
1.2K0
MapReduce之Eclipse本地运行
hadoop入门五步走
可以浏览w3c的描述,熟悉hadoop的概念 https://www.w3cschool.cn/hadoop/
用户1418372
2019/04/17
4890
hadoop入门五步走
《快学BigData》--Hadoop总结(G)(40)
Hadoop总结 - - - - - - - - - - - - - - - - - - - - - - - - - - - - 210
小徐
2019/08/05
4130
《快学BigData》--Hadoop总结(G)(40)
Hadoop作业引用第三方jar文件
在eclipse中写mapreduce程序, 引用第三方jar文件, 可以利用eclipse Hadoop插件直接run on hadoop提交, 很方便. 不过插件版本要和eclipse匹配, 不然总是local执行, 在50070是没有job产生的.
星哥玩云
2022/06/29
9460
Hadoop作业引用第三方jar文件
Hadoop学习:深入解析MapReduce的大数据魔力(一)
在大数据时代,高效地处理海量数据成为了各行各业的迫切需求。Hadoop作为一种重要的大数据处理框架,其核心概念之一就是MapReduce。今天开始将深入了解MapReduce,探索其在大数据处理中的重要作用。
老虎也淘气
2024/01/30
4010
Hadoop学习:深入解析MapReduce的大数据魔力(一)
运行Hadoop自带的单词统计程序
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64 export PATH=JAVA_HOME/bin:PATH export CLASSPATH=.:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar
zhangjiqun
2024/12/17
760
运行Hadoop自带的单词统计程序
大数据技术之_05_Hadoop学习_02_MapReduce_MapReduce框架原理+InputFormat数据输入+MapReduce工作流程(面试重点)+Shuffle机制(面试重点)
1、问题引出   MapTask的并行度决定Map阶段的任务处理并发度,进而影响到整个Job的处理速度。 思考:1G的数据,启动8个MapTask,可以提高集群的并发处理能力。那么1K的数据,也启动8个MapTask,会提高集群性能吗?MapTask并行任务是否越多越好呢?哪些因素影响了MapTask并行度?
黑泽君
2019/03/04
7070
大数据技术之_05_Hadoop学习_02_MapReduce_MapReduce框架原理+InputFormat数据输入+MapReduce工作流程(面试重点)+Shuffle机制(面试重点)
MapReduce实战-词频统计、文件合并排序
hadoop伪分布式集群环境,包括设置JAVA_HOME、HADOOP_HOME等。 可参考使用docker部署hadoop集群-手把手复现
唔仄lo咚锵
2021/12/31
7140
MapReduce实战-词频统计、文件合并排序
大数据技术之_05_Hadoop学习_04_MapReduce_Hadoop企业优化(重中之重)+HDFS小文件优化方法+MapReduce扩展案例+倒排索引案例(多job串联)+TopN案例+找博客
  MapReduce优化方法主要从六个方面考虑:数据输入、Map阶段、Reduce阶段、IO传输、数据倾斜问题和常用的调优参数。
黑泽君
2019/03/08
5990
MapReduce操作实例
要点:有一个combiner方法,可以在执行完map时调用,从而对数据进行先一步的处理,降低Reduce的IO压力。
曼路
2018/10/18
1.5K0
MapReduce应用:广告数据分析
整个需求可以分为两个作业 - 统计作业:按天统计报告量 - 排序作业:按照曝光量进行全排序;依赖于前一个作业的输出结果;升序依赖MR的shuffle阶段对key进行升序排序的特征;降序需要重写key的比较器
程裕强
2022/05/06
6600
MapReduce应用:广告数据分析
使用MapReduce运行WordCount案例
注意:准备的数据的格式必须是文本,每个单词之间使用制表符分割。编码必须是utf-8无bom
孙晨c
2020/07/16
5260
一脸懵逼学习MapReduce的原理和编程(Map局部处理,Reduce汇总)和MapReduce几种运行方式
别先生
2018/01/02
2.9K0
一脸懵逼学习MapReduce的原理和编程(Map局部处理,Reduce汇总)和MapReduce几种运行方式
jar包在Hadoop集群上测试(MapReduce)
本片使用MapReduce——统计输出给定的文本文档每一个单词出现的总次数的案例进行,jar包在集群上测试 1、添加打包插件依赖 <build> <plugins> <plugin> <artifactId>maven-compiler-plugin</artifactId> <version>3.6.2</version> //这里换成对应版本 <confi
栗筝i
2022/12/01
4220
jar包在Hadoop集群上测试(MapReduce)
本地Eclipse提交MR程序到Yarn
1、一般地,从Windows本地的Eclipse提交程序到yarn,会报如下错误: Diagnostics: Exception from container-launch. Container id: container_1526537597068_0006_02_000001 Exit code: 1 Exception message: /bin/bash: line 0: fg: no job control Stack trace: ExitCodeException exitCode=1: /
sparkle123
2018/07/04
5540
Hadoop学习笔记—9.Partitioner与自定义Partitioner
  在第四篇博文《初识MapReduce》中,我们认识了MapReduce的八大步凑,其中在Map阶段总共五个步骤,如下图所示:
Edison Zhou
2018/08/20
6220
Hadoop学习笔记—9.Partitioner与自定义Partitioner
Hadoop快速入门——第三章、MapReduce案例(字符统计)
8、上传【jar】包以及【info.txt】文件至【/opt/soft/hadoop/share/hadoop/mapreduce】 下
红目香薰
2022/11/29
2800
Hadoop快速入门——第三章、MapReduce案例(字符统计)
推荐阅读
相关推荐
MapReduce集群运行模式详细步骤(小白也看的懂的步骤)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验