mapreduce工作原理_hadoop mapreduce 原理_redis工作原理 - 腾讯云开发者社区

java、hadoop、mapreduce

我正在尝试编写MapReduce作业，它可以在Mapper中读取两个序列文件。我试过在“main”中读取和写入序列文件，但我不知道如何在Mapper中实现。我认为我不太熟悉MapReduce的工作原理。谢谢你帮我。

浏览 0提问于2015-07-12得票数 0

回答已采纳

2回答

如何知道SQL查询中映射了哪些内容以及减少了哪些内容？

hadoop、hive

我看过MapReduce的维基页面，但我不认为我完全理解。据我所知，查询分为map步骤和reduce步骤。因此，为了利用这一点，我们应该更多地使用GROUP BY，并将工作从map步骤移动到reduce步骤。我不太确定这是如何工作的。这看起来太神奇了。我想知道一组编写SQL查询以利用MapReduce的指导原则。我如何知道哪些子句在map步骤或reduce步骤中？它背后的理论是什么？我想了解它的原理和内部工作原理，这样我就可以写出更好的查询。

浏览 2提问于2013-04-10得票数 1

1回答

在hadoop中连接vs分布式缓存

hadoop、mapreduce

我真的混淆了地图端连接和约简端连接，它的工作原理。在mapreduce作业中处理数据时，分布式缓存是如何不同的。请与大家分享。你好，拉维

浏览 2提问于2015-01-23得票数 2

回答已采纳

1回答

Oozie设置LD_LIBRARY_PATH

java、hadoop、oozie、oozie-workflow

这指的是一些本机库，我尝试设置以下内容 <property> </property> <name>mapreduce.child.envv

浏览 1提问于2018-03-16得票数 0

回答已采纳

1回答

SQL和SQL-MR查询在Teradata aster内部是如何工作的？

sql、hadoop、mapreduce、teradata

我已经阅读了文档和博客，但没有在哪里解释查询是如何工作的。由于sql和sql-mr获取数据的方式是分布式的，那么它们是否会在内部生成map reduce作业？例如，customer表有10条记录，这些记录通过散列(客户id)分布，并假设它们是3个工作进程(除了asterdata中的节点)，数据在它们之间拆分为3个记录，每个记录在两个节点上，4个记录在一个节点上在SQL中，简单的select * from customers；在这种情况下可以工作吗？它如何从3个节点获取记录？如果普通的sql查询可

浏览 0提问于2014-05-23得票数 0

4回答

Hadoop Map Reduce与Google Map Reduce的差异

hadoop、mapreduce

Hadoop Map Reduce和Google Map Reduce有什么区别？

浏览 2提问于2012-07-08得票数 18

1回答

如何在Hadoop Yarn中预测MapReduce作业执行前的执行时间

facebook

MapReduce作业的执行时间在作业完成后可用。但我还没有找到任何方法来提前预测它的执行时间。

浏览 3提问于2015-01-29得票数 2

1回答

将键值路由到Hadoop二级排序中的正确减速器

hadoop、partitioner

我有三个减速机，我需要它们每个都得到相同的钥匙，如下所示：AAPL - Reducer 1在除数器中，getPartition()方法应该返回一个int，指示减速器的索引(0,1,2)之一。return ((CompositeKey) key).getSymbol().hashCode() % numReduceTasks; int numReduceTasks = 3; System.out.println("GOOG".

浏览 2提问于2013-11-02得票数 1

回答已采纳

1回答

MongoDB / PHP / MapReduce / Reg Exp /Strings>Floats

php、mongodb、mapreduce

我是MapReduce的新手，但我有一个集合，我想用它来学习mapreduce的工作原理。

浏览 1提问于2018-11-03得票数 0

2回答

映射减少和nosql之间的关系是什么？

database、mapreduce

我想在我的应用程序中使用nosql。nosql的目的是存储用户日志数据，使用和分析这些数据，并为用户提供定制数据。在此，我们了解了地图约简的搜索算法和快速处理大量日志数据的方法。谢谢。

浏览 2提问于2018-03-28得票数 0

回答已采纳

2回答

如何基于查询构建自定义DatastoreInputReader？

google-app-engine、mapreduce

其基本原理是尽量减少读取(因为查询被索引到一个子集)和处理时间。第二，如何做？那些可以指向显示自定义datastoreinputreader实现的工作代码(github或其他代码)的Brownie点。这将极大地提高AppEngine MapReduce开发人员的可访问性或友好性;-)

浏览 3提问于2012-07-02得票数 3

1回答

MapReduce在Mongo工作，而不是在C#工作。

c#、mongodb

我试图在我的应用程序中运行一个MapReduce查询。我创建了相关的JS，并通过Mongo验证了它的工作原理： if (this.class_artist !value.forEach(function(value) { });}op

浏览 3提问于2014-04-09得票数 0

回答已采纳

1回答

mongodb:当只有一个结果时，reduce函数不是action

mongodb

如下所示进行编码{ mapreduce : "<collecton>" ,{ emit ({nkey: this.nkey}, {price

浏览 2提问于2014-05-15得票数 0

1回答

为job.splitmetainfo选择计数(*)文件创建的异常

hadoop、hive、hiveql

我试过这个查询其中，'table1‘是hive中的表名，它的工作原理很好，并给出了结果。hadoop-yarn/staging/anonymous/.staging/job_1453359797695_0017/job.splitmetainfo at org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl$InitTransition.createSplits(JobImpl.java:1

浏览 11提问于2016-01-23得票数 0

回答已采纳

1回答

如何在MapReduce程序中使用本地聚合方法，如in-mapper组合器？

java、algorithm、hadoop、mapreduce

我想实现一个词长程序，通过使用本地聚合方法对大型语料库上的4个类别的单词进行分类，但我对这些方法的工作原理没有深入的了解。因为我是MapReduce领域的新手。

浏览 2提问于2015-02-01得票数 1

2回答

如何使脚本在经过特定时间后自动结束？

bash、shell、ubuntu、kill、kill-process

/bin/sh (time hive --hiveconf mapreduce.job.reduce.slowstart.completedmaps=0.5 --hiveconf mapred.reduce.tasks=10 --hiveconf mapreduce.reduce.shuffle.parallelcopies=15 --hiveconf

浏览 1提问于2015-09-21得票数 3

回答已采纳

3回答

在随机分区程序中过滤行键数据

hadoop、mapreduce、cassandra

我正在研究Cassandra Hadoop集成(MapReduce)。我们使用RandomPartitioner来插入数据，以获得更快的写入速度。现在，我们必须在MapReduce中读取来自Cassandra的数据，并对其执行一些计算。使用二级索引(仍在尝试了解它们的工作原理)可以解决我的问题吗?还是有其他方法可以绕过它？我想使用cassandra MR来计算一些KPI的数据，这些数据连续存储在cassandra中。因此，为了计算KPI，我将工作一分钟，并从其他CF获取数据，然后对其进行处理。

浏览 2提问于2012-12-11得票数 0

回答已采纳

1回答

通用选项语法中的Hadoop mapreduce.job.reduces？

hadoop、mapreduce

hadoop jar mrjobs-0.1.jar com.example.Weather -D mapreduce.job.reduces=2 datasets/inputs output 当我添加-D选项时，这个命令就不能工作了，否则它就能正常工作了。

浏览 2提问于2014-11-17得票数 0

回答已采纳

1回答

oozie作业中的错误

mapreduce、oozie

我有一个WordCount MapReduce作业，当它从hadoop运行时，它运行良好，并给出了输出。;import org.apache.hadoop.mapreduce.Reducer;import org.apache.hadoop.mapreduce.lib.output.FileOu

浏览 4提问于2016-04-09得票数 0

回答已采纳

3回答