命令列出HADOOP 2.x中的映射器和缩减器的数量

文章/答案/技术大牛

发布

1回答

java、hadoop-yarn、hadoop2

是否有任何hadoop/yarn命令可以动态列出作业使用的映射程序/减速器/插槽的数量

浏览 10提问于2019-02-19得票数 0

2回答

如何在Hadoop中将参数传递给主程序

java、hadoop、mapreduce

每次运行Hadoop程序时，我都需要更改映射器和减法器的数量。有没有办法从命令行(当我运行程序时)将映射器和缩减程序的数量传递给我的程序，然后使用args检索它？

浏览 8提问于2013-05-28得票数 4

1回答

使用python模块的hadoop流

python、hadoop、hadoop-streaming

我见过一种技术(在stackoverflow上)，可以使用zip文件存储引用的python模块来执行hadoop流作业。inputdatafile.txt | .但是，当我在hadoop中

浏览 6提问于2012-09-23得票数 0

回答已采纳

3回答

如何在新的Hadoop api中设置映射器数量？

hadoop、mapreduce

我已经从旧的Hadoop api (mapred)切换到新的Hadoop api (mapreduce)。我无法在新的api中设置映射器的数量。我可以使用job.setNumReduceTasks()来设置缩减的数量，但是没有任何方法来设置映射器的数量。我还尝试了conf.setInt("mapred.map.task

浏览 2提问于2013-12-29得票数 0

2回答

将输入文件与输出文件相关联

hadoop、mapreduce

我有一份MR流媒体的工作。我的代码是C++编写的。这是一个映射程序唯一的工作，没有减速器。作业的输入是一个包含三个文件的目录。Job创建3个映射器。每个映射器处理一个输入文件并生成一个不同格式的输出文件。例如，输入文件MyDir/file1可以对应于输出文件MyDir/Output/part-00002，即，处理后的输入文件MyDir/file1可能已经产生输

浏览 2提问于2012-01-24得票数 1

4回答

配置Hadoop集群时需要设置多少个映射器/缩减器？

map、hadoop、reduce

配置Hadoop集群时，设置集群映射器/缩减器数量的科学方法是什么？

浏览 0提问于2012-04-05得票数 4

回答已采纳

1回答

通过Hadoop Streaming运行Python脚本时，得到"ValueError: No Json object via be decoded“

python、json、hadoop、mapreduce

我正在尝试通过流在Hadoop上运行一个简单的python mapreduce脚本。映射器部分加载一个json文档，从一个属性中读取文本，并将文本中的每个单词用1表示，稍后将由脚本的缩减部分求和。代码在Hadoop之外运行得很好。一旦提交到Hadoop，映射就会失败，并显示"ValueError: No Json object map be decoded“。错误行是带有"json.loads()

浏览 1提问于2015-11-04得票数 0

1回答

配置单元中使用了多少个映射器来处理1 1GB的进程表

hadoop、hive、hdfs、mapper

这是有人问我的.. 如果有10个节点，需要在配置单元中处理1 1GB表。那么使用了多少个映射器呢？

浏览 0提问于2016-04-23得票数 0

1回答

hadoop:跟踪MapReduce任务

python、hadoop、mapreduce

我是hadoop的新手，这可能是一个愚蠢的问题，但我已经找了几个小时了，就是找不到怎么做。我使用不同数量的映射器和缩减程序运行Hadoop MapReduce，以查看性能上的差异(例如执行时间)。我想检查是否使用了指定数量的映射器/缩减程序，但我就是不知道如何做到这一点。Hadoop 1.2.1安装在具有超线程<em

浏览 1提问于2013-12-04得票数 0

1回答

如何在Hadoop集群上运行Hadoop Streaming？

hadoop、cluster-computing、hadoop-yarn、hadoop-streaming

目前我有一个有3个节点的Hadoop集群(Ubuntu) 我想运行带有Hadoop流的python /R脚本，但是我不确定仅仅执行HS是否真的能使所有节点工作如果可能，请告诉我在群集上运行流的方向

浏览 21提问于2020-04-25得票数 0

1回答

为什么EMR实例没有像映射器一样多的缩减程序呢？

memory、hadoop、amazon-web-services、elastic-map-reduce、reducers

默认情况下，在EMR作业期间，实例被配置为具有比映射器更少的reducers。但是，reducers没有被赋予任何额外的内存，所以看起来它们应该能够拥有相同的内存量。(例如，超大型高cpu实例有7个映射器，但只有2个减速器，但映射器和减速器都配置了512 MB的可用内存)。有人知道这是为什么吗?有没有什么方法可以让我指定使用与映射器一样多的reducers？

浏览 2提问于2012-04-17得票数 3

2回答

Hadoop:映射器和缩减器的数量

hadoop、mapreduce

我在1.1 on的文件上多次运行Hadoop MapReduce，使用不同数量的映射器和减速器(例如，1个映射器和1个减速器，1个映射器和2个减速器，1个映射器和4个减速器，...)Hadoop安装在采用超线程的四核机器上。-8个映射器的结

浏览 0提问于2013-12-01得票数 9

回答已采纳

1回答

有没有办法在滚烫中指定映射器的数量？

mapreduce、scalding

我是第一次接触滚烫的世界。我的滚烫工作将有多个阶段，我需要单独调整每个阶段。我错过了什么吗？有人知道如何为我的子任务指定映射器的数量吗？谢谢。

浏览 4提问于2018-08-28得票数 0

1回答

映射器发出的键值对的数量有限制吗？

hadoop、mapreduce

在Map Reduce程序中，单个映射器可以发出的键值对的数量是否有上限？谢谢

浏览 0提问于2016-10-18得票数 2

3回答

Pig:强制在Reducer或设置映射器数量中出现UDF

apache-pig

我有一个猪脚本，它运行一个非常耗时的UDF。Pig似乎正在将UDF设置为作为映射作业运行，而不是作为reduce作业运行。因此，创建了少量的次优映射器来运行该作业。我知道我可以使用setDefaultParallel设置要在pig中使用的缩减程序的默认数量，也可以使用PigLatin中的PARALELL x命令为给定行设置缩减程序的数量。但是如何设置映射器

浏览 1提问于2013-04-01得票数 4

回答已采纳

1回答

Hadoop流和多个reducer步骤，每个步骤之间没有映射器

hadoop、streaming、mapreduce、mapper

我正在解决如何对数据进行多次排序，而不必每次都返回到映射器。我想设置: mapper 1 --> reducer 1-> reducer 2-> reducer 3每当我尝试在没有映射器的情况下运行时，它都会以一个错误结束。

浏览 0提问于2012-09-12得票数 4

1回答

如果单独JVM意味着单独的OS进程

java、hadoop

单独的JVM中的每个映射和缩减任务是否意味着hadoop上下文中的每个映射器和每个缩减程序都有单独的操作系统进程？

浏览 0提问于2012-10-12得票数 0

回答已采纳

2回答

如何在Mahout MatrixMultiplicationJob中增加映射器的数量？

hadoop、matrix、mapreduce、mahout、multiplication

我使用Mahout0.7的MatrixMultiplicationJob来乘以一个大的矩阵。但它总是使用一个map任务，这使得它变得很慢。这可能是由于InputSplit强制将映射器的数量设置为1。有没有一种方法可以在Hadoop / Mahout中高效地乘以矩阵或更改映射器的数量？

浏览 0提问于2012-10-04得票数 2

回答已采纳

1回答

Hadoop映射器运行缓慢

hadoop、mapreduce

我正在尝试同时使用映射器和缩减程序运行作业，但映射器运行速度很慢。如果对于相同的输入，我禁用了缩减程序，映射器在3分钟内完成，而对于映射器-缩减程序作业，即使在30分钟结束时映射器也没有完成。我使用的是Hadoop1.0.3 ..I，在压缩和不压缩两种情况下都尝试过。我删除了hadoop 0.20.203的旧版本，并重新安装了

浏览 1提问于2012-10-03得票数 1

1回答

如何做一个3阶段的Map Reduce流？

python、hadoop、mapreduce、hadoop-streaming

我是hadoop的新手。目前我有一个映射器，一个缩减器和一个组合器。我可以做cat file | mapper.py | reducer.py | combiner.py来产生结果。而缩减阶段令人尴尬地并行不悖。那么，如果我有一个hadoop集群，谁能告诉我如何将其应用到hadoop流中？

浏览 0提问于2015-01-30得票数 0

点击加载更多