Java Map Reduce拆分方法_拆分map reduce方法单项错误_简单的Java Map/Reduce框架 - 腾讯云开发者社区

java、split、mapreduce

.csv文件： Country,num1,num2,remarksUSA, 1, 2, "string 2, string 3, string 1" 我需要为Map-Reduce任务拆分每一行。有没有办法拆分备注字段？我的最终目的是创建具有如下值的键： USA, string 1USA, string 3 USA, string 1 假设我有一个名为line的变量，它包含整个行字符串，我尝试过这样的方法

浏览 16提问于2020-05-03得票数 1

2回答

拆分map reduce方法单项错误

javascript、reactjs

我有一个计算平均值的split.map.reduce方法。如果有两个以上的数字，它工作得很好。我希望只有当有两个或更多的值时才使用此方法。示例: 8,6,10 | AVG = 8,00 (工作正常) 示例2: 9| AVG =9(如果只有一个值，它会给我一个错误) 这是我的方法： grade.grade.split(',') .reduce((a, c, i, arr) => {a +=

浏览 20提问于2021-06-26得票数 1

回答已采纳

1回答

Mapreduce -处理大型xml文件时的堆内存问题

xml、hadoop、mapreduce

", "-Xmx14096m -Xss2048m") conf.set("mapreduce.reduce.child.java.opts", "-Xmx3024mconf.s

浏览 3提问于2014-10-15得票数 1

1回答

执行和捕获来自python的java执行的输出

java、python、hadoop、jar

当作业正在运行时..hadoop为我提供了进度..喜欢Map 20%, Reduce 0%现在，我想要做的是..从python调用此程序(使用简单的系统执行..)因此，我正在寻找一种方法来捕获jar执行所显示的这些统计信息，并在python中对其进行处理，并显示处理后的统计信息。对于example..By默认设置，hadoo

浏览 1提问于2013-10-23得票数 4

1回答

Hadoop -在map函数中获取拆分in

hadoop、mapreduce

我正在用map reduce做一个项目。我假设每个拆分都有一个与之关联的ID或编号。我想知道是否有任何方法可以获得这个拆分的Id/数字，甚至是块Id/数字作为map函数的关键字？map(split_id, data)

浏览 0提问于2015-10-19得票数 0

3回答

HBase mapreduce作业如何与服务器通信？(新手问题)

java、hadoop、hbase

我刚接触Hadoop和HBase，即使我读过allot，我仍然不理解map reduce job API的基本层次结构和工作流程。据我所知，我需要使用java API来实现某些类，并将它们传递给hbase，它将协调拆分和分发过程。对吗？如果是，应用程序如何与服务器通信以传递map reduce作业的相关代码？

浏览 1提问于2011-06-27得票数 1

回答已采纳

1回答

在hdfs中复制输入拆分的次数

mapreduce

每个输入拆分在hadoop集群中复制3次。对于每个复制拆分，hadoop会分配每个map吗？如果是，则指定将哪个map结果发送到reduce函数。hadoop是否也复制了reduce函数

浏览 2提问于2014-07-21得票数 0

1回答

MapReduce作业停止执行

hadoop、mapreduce、benchmarking、cloudera-cdh、cloudera-manager

我想在TeraSort集群上运行一个基于Hadoop的基准测试。脚本正在工作，首先它处于运行状态，但几分钟后它就陷入了Accepted状态和FinalStatus未定义状态。我曾经想过，这可能是一个资源问题，所以我像上面那样修改了yarn-site.xml。 <name>yarn.nodemanager.resource.memory-mb</name> <description>Amount of physical memory, in MB, t

浏览 0提问于2016-03-06得票数 0

回答已采纳

1回答

根据不同的参数将一个Collection(使用java 8 streams)拆分成更小的组件

java、java-8、java-stream

} String pId;//getters and setter here我的问题是根据一些动态参数将一个Collection(使用Java8streams)拆分成更小的组件。(BigRequest big){} //groupingBy function but that returns a Map Map<String, List<Parts(可能是

浏览 1提问于2017-04-04得票数 0

3回答

使用同一文件的拆分提供地图拆分

java、hadoop、mapreduce、hadoop-partitioning

如何向映射器提供文件的每一行以及同一文件的拆分？for each line in file-split //process我可以在java中使用map reduce来做这件事吗？

浏览 0提问于2014-03-02得票数 0

1回答

设置输入分割的映射器Hadoop数不工作

java、hadoop、mapreduce、hdfs、mapper

:submitJobInternal(396)) - number of splits:7File System Counters FILE: Number of large read operations=0Map-ReduceFramework <e

浏览 2提问于2016-11-19得票数 0

3回答

Hadoop中的拆分大小与块大小

hadoop、mapreduce、hdfs

在Hadoop中，拆分大小和块大小是什么关系？当我在中读取时，拆分大小必须是块大小的n倍(n是整数且n> 0)，对吗？拆分大小和块大小之间是否存在必然的关系？

浏览 0提问于2015-05-31得票数 16

回答已采纳

1回答

如何使用AES算法、Hadoop和Java加密一个大的文本文件？

java、encryption、hadoop、aes

我有一个大的文本文件(100 am或更多)，我想使用Hadoop和Java (Map/Reduce函数)使用AES算法加密文本文件的内容，但是由于我对Hadoop还不熟悉，所以我不太确定如何启动它。我找到了JCE (一个Java库)，AES已经实现了，但是我必须提供16个字节的文本和一个密钥来生成一个16字节的密码文本(加密输出)。我的问题是如何使用这种JCE/AES方法来实现我的目标？我应该如何分割我的大输入文本文件，应该将什么传递给Mapper类的map方

浏览 4提问于2013-11-19得票数 0

回答已采纳

1回答

map reduce中有没有控制输入拆分的方法

hadoop、map、mapreduce

我每小时有很多小的(150-300KB)文本文件9000，我需要通过map reduce处理它们。我创建了一个简单的MR，它将处理所有文件并创建单个输出文件。我开始挖掘性能不佳的原因，我发现它需要和文件数量一样多的输入-拆分。正如我猜测的，这是性能不佳的一个原因。有没有办法控制输入拆分，这样一个输入拆分/映射就可以处理1000个文件。

浏览 1提问于2014-02-06得票数 0

1回答

为什么mapreduce要将压缩文件拆分成输入拆分？

hadoop、mapreduce

如果我想在这个压缩文件上运行map-reduce作业，map reduce会再次尝试拆分该文件。为什么mapreduce不自动使用hdfs中的16个块，而是重新拆分文件？

浏览 2提问于2014-07-24得票数 1

1回答

从hbase表中映射约简特定区域数据

hadoop、hbase

我想知道是否有一种方法可以将reduce映射到hbase表中某些选定的数据区域。我的意思是，有没有一种方法可以指定Map reduce应该采用表的哪些区域，而不是采用整个表并根据区域的数量拆分任务。

浏览 0提问于2012-06-26得票数 0

回答已采纳

3回答

hadoop如何读取输入文件？

csv、hadoop

如果是，我想使用逗号拆分的字符串来获取要分析的字段。或者有没有其他更好的方法来解析csv并将其提供给hadoop？该文件大小为10 GB，以逗号分隔。我想在hadoop中使用java。在下面的map()方法中，Tex类型的参数"value“包含Map/Reduce解析的每一行--这是我最困惑的地方。这是我的代码： public void map(LongWritable key, Text value, Context contex

浏览 8提问于2013-10-20得票数 5

2回答

在collectionA上执行的map/reduce中从collectionB访问数据

mongodb、database

如何在collectionA上执行的map/reduce的"map“部分中访问collectionB中的数据？如果有帮助，我将短语存储在collectionA中，希望将每个短语拆分成映射中的单个单词，然后从collectionB中获取每个单词的特定值。在代码中，我想象它会像下面这样的… var key, value; var results = db["collectionB"].find({something_

浏览 1提问于2011-03-15得票数 1

2回答

确定Hadoop中的Reduce数量

hadoop

在Hadoop中，map的数量由输入拆分的数量决定。reduce的数量是多少？如果有一种方法，我们可以直观地确定约简？我在做小猪的地图缩减。

浏览 3提问于2015-07-01得票数 0

1回答

"errmsg“：”异常:映射调用失败: JS错误: TypeError: this.characters没有属性nofile_b:1"，

mongodb

我使用以下脚本对MongoDB中characters列中的数据进行了拆分和计数。处理null值时出现错误。请帮帮我。map = function() { emit(this.characters, array.length); return values[0]; "mapre

浏览 1提问于2012-09-25得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云