Spark wordcount开发并提交到单机(伪分布式)运行

24-丰总

发布于 2018-06-14 14:34:50

4910

发布于 2018-06-14 14:34:50

文章被收录于专栏：24k24k

使用的ide是idea

packagecom.fsl

importorg.apache.spark.{SparkConf,SparkContext}

/**

* Created by Juvenile on 2017/2/24.

* 统计字符出现次数

objectWordCountScala {

defmain(args: Array[String]) {

if(args.length <1) {

System.err.println("Usage: ")

System.exit(1)

}

valconf =newSparkConf()

valsc =newSparkContext(conf)

valline = sc.textFile(args(0))

line.flatMap(_.split("\t")).map((_,1)).reduceByKey(_ + _).collect.foreach(println)

sc.stop

}

导出成jar包。

上次到集群服务器: mySparkTest-1.0.jar

进入spark文件夹下执行 spark-submit --name WordCountScala --class com.fsl.WordCountScala --master spark://master:7077 --executor-memory 1G --total-executor-cores 1 /root/mySparkTest-1.0.jar hdfs://master:9000/user/data.txt 即可

本文参与腾讯云自媒体分享计划，分享自作者个人站点/博客。

原始发表：2017.02.24 ，如有侵权请联系 cloudcommunity@tencent.com 删除

spark

分布式

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

spark

分布式

登录后参与评论

0 条评论

热度

Spark wordcount开发并提交到单机(伪分布式)运行

Spark wordcount开发并提交到单机(伪分布式)运行

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐