首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >在Hadoop2.3下运行WordCount程序

在Hadoop2.3下运行WordCount程序

作者头像
星哥玩云
发布2022-06-30 18:58:12
发布2022-06-30 18:58:12
5940
举报
文章被收录于专栏:开源部署开源部署

1、如果hdfs没有启动,则在haoop主目录下启动:  ./sbin/start-dfs.sh   ./sbin/start-yarn.sh 

2、查看状态,保证有数据节点在运行 ./bin/hdfs dfsadmin -report

看到如下状态表示一切正常 Datanodes available: 1 (1 total, 0 dead)

这一步也可以用浏览器查看:http://localhost:50070

3、新建几个数据文件,如file1.txt,file2.txt,我是放到Hadoop主目录下的examples目录里 examples/file1.txt 内容如下: hello  www.linuxidc.com hello  www.linuxidc.net hello  www.6688.cc hello  www.88181.com

examples/file2.txt 内容如下: pmpbox  ok pmpbox  v1.0 pmpbox  online I think pmpbox will help you!

4、把文件拷贝到hadoop文件系统 ./bin/hadoop fs -mkdir /input ./bin/hadoop fs -put -f examples/file1.txt examples/file2.txt /input

5、运行 WordCount ./bin/hadoop jar ./share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.3.0-sources.jar org.apache.hadoop.examples.WordCount /input /output 运行中会显示进度。

6. 查看结果命令 ./bin/hadoop fs -cat /output/part-r-00000

也可把结果从hdfs拷到文件系统中保存 ./bin/hadoop fs -cat /output/part-r-00000

下面就是WordCount程序执行结果: I 1 hello 4 help 1 ok 1 online 1 pmpbox 4 think 1 v1.0 1 will 1 www.88181.com 1 www.linuxidc.com 1 www.linuxidc.net 1 www.6688.cc 1 you! 1 下面的代码出自 JDK 文档)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档