map-reduce - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

什么时候需要map reduce来进行数据库查询？

、、、、

在MongoDB中，您可以使用它们的查询方法来检索数据，但它们也允许您执行map-reduce。我想知道，我什么时候真正需要map-reduce？这些查询方法是不同于map-reduce的，还是仅仅是map-reduce函数的包装器？

浏览 2提问于2010-09-18得票数 1

回答已采纳

2回答

线程和Map-Reduce处理之间的区别？

、

我的一位同事正在与我争论在我们的应用程序(文本处理)中引入map-reduce概念。他的观点就是为什么我们不应该使用线程的概念，instead.We两者都是这种map-reduce范例的新概念。我认为使用map-reduce概念可以帮助开发人员减少处理线程同步、死锁和共享数据的开销。除了这个之外，还有什么比线程更适合map-reduce的概念吗？

浏览 0提问于2012-12-11得票数 5

1回答

Hive是以什么模式安装的？

配置单元安装有什么特定的模式吗？

浏览 0提问于2013-05-30得票数 2

1回答

我有一个map-reduce作业，它的输入是一个大数据集(假设大小为100 of )。这个map-reduce作业所做的是将大数据拆分成块，并写入单独的文件，每个数据块一个文件。此map-reduce作业的输出用作另一个map-reduce作业的输入。由于新输入由多个文件组成，每个文件的大小为64MB，那么第二个map-reduce作业中的每个映射器是只读取一个文件还是可能读取多个文件？

浏览 1提问于2013-09-21得票数 0

1回答

mongo的MR可以将结果写入另一个分片集合吗？

、、、

根据Mongo MR文档()，分片数据上的MR作业的输出可以将结果写入另一个分片集合，但是只有_ID可以用作分片键。

浏览 2提问于2012-05-08得票数 0

1回答

map reduce可以做哪些工作，而apache crunch不能？

、

据我所知，crunch是一个基于map-reduce框架的抽象框架。我打算使用crunch而不是map-reduce框架。我的问题是，map-reduce可以做哪些工作，而crunch不能？

浏览 4提问于2015-12-22得票数 2

1回答

计算工作集的过程是什么？

假设我想对此数据运行Map-Reduce，并估计此应用程序所需的RAM。在map-reduce操作期间，将不会对此数据库进行读或写操作。map-reduce将聚合一些记录，并对聚合的记录进行逻辑比较。我想了解map-reduce如何将数据带入RAM，因此应该如何计算工作集(例如:我是否应该假设1 MM x 5KB将是我的工作集)。

浏览 0提问于2012-05-07得票数 2

回答已采纳

2回答

配置单元始终创建mapreduce作业

、、

我在工作中一直使用hive，当我运行这样的select配置单元执行mapreduce作业，当我运行配置单元不执行mapreduce作业。对这个事实有什么想法吗？

浏览 3提问于2015-08-03得票数 0

1回答

集群遗传编程/算法

、、

最近，我一直在尝试了解hadoop集群是否可以用于遗传算法/编程作业。我一直在读有关hadoop的文章，我知道它可以并行化处理大型数据集。在我的情况下，我不会有很大的数据集。但我发现真正有用的是hadoop的并行化功能。所以，我的问题是，像hadoop这样的程序是否可以用于评估或处理遗传算法/编程，我认为它将更多地面向处理，而不是面向I/O？

浏览 4提问于2011-11-06得票数 6

1回答

map reduce是否始终与平台即服务不同？

、

谷歌应用程序引擎本身是否有map-reduce，或者我应该使用map-reduce吗？提前谢谢。

浏览 1提问于2013-04-18得票数 1

1回答

hadoop上KMeans集群的map和reduce阶段中的WEKA类

、、、、

我想在mapreduce程序中使用WEKA的类在实例上执行KMeans集群。我只想要一个map和reduce类的概述。如何在Reducer类中查看WEKA类计算的距离？

浏览 1提问于2015-05-27得票数 0

1回答

我应该在哪里写mapreduce程序

、

我应该在哪里写map-reduce程序-在文本文件或任何其他文件中？在java中，文本文件，将java代码保存为filename.java，但对map-reduce程序将是什么呢？因为我非常需要，所以请回答。

浏览 1提问于2013-03-23得票数 0

2回答

为什么Hadoop map reduce作业中允许的计数器数量有限制？

、、

我正在使用Hadoop map-reduce，当我尝试以编程方式创建许多作业计数器时，我得到了一个CountersExceededException。我知道我可以通过配置文件增加允许的计数器数量，但有谁知道：和 b)增加map-reduce计数器的最大数量是否是一个好主意？

浏览 2提问于2012-06-28得票数 5

回答已采纳

1回答

如果HDFS中的输入数据源不断增加，MapReduce作业会发生什么情况？

、

我们有一个运行HDFS的日志收集代理，即该代理(如Flume)不断从一些应用程序收集日志，然后将其写入HDFS。读写过程不间断地运行，导致HDFS的目标文件不断增加。FileInputFormat.addInputPath(job, new Path("hdfs://namenode:9000/data/collect"));

浏览 2提问于2015-06-29得票数 1

2回答

如何在倒排索引搜索中使用map-reduce？

、、、、

很容易理解map-reduce是如何用于收集文本和构建大型倒排索引的。但是如何在倒排索引搜索中使用map-reduce呢？

浏览 2提问于2012-01-25得票数 3

回答已采纳

1回答

不带hadoop但有其他MR实现的mahout

、、

在Mahout中用不同的map-reduce实现(比如内存中的map-reduce实现)替换hadoop容易吗？Mahout并行ML实现是否与Hadoop紧密耦合且不可替代？

浏览 1提问于2012-05-29得票数 1

1回答

MPI标准与Map-Reduce编程模型的比较？

、、、

但我对Map-Reduce编程模型了解不多。它们之间的确切区别是什么？ Which one is better and when?

浏览 0提问于2012-02-24得票数 4

回答已采纳

3回答

在HDFS上未找到Oozie作业配置应用程序目录

、、、、

] does not existtim@phocion:~$ hdfs dfs -ls /user/tim/examples/apps/map-reduce Found 3 items-rwxr-xr-x 1 tim tim 995 2012-10-03 14:47 /user/tim/examples/apps/map-reduce/job.propertiesdrwxrwxr-x - tim tim

浏览 2提问于2012-10-04得票数 5

1回答