haoop_我们都知道hadoop3.x MapReduce需要mapred-site.xml中的HADOOP_MAPRED_HOME，为什么haoop2.x不需要HADOOP_MAPRED_HOME？为什么？ - 腾讯云开发者社区

linux、windows、bash、hadoop

hadoopcd hadoopcd hadoopcd hadoop bin&

浏览 0提问于2014-01-28得票数 0

回答已采纳

1回答

为什么星火作业在Mesos上的"hadoop: not“失败？

apache-spark、mesos、mesosphere

我在Debian 8上使用Spark1.6.1、Hadoop2.6.4和Mesos 0.28。I0427 22:35:39.626055 48258 fetcher.cpp:424] Fetcher Info: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/ad642fcf-9951-42ad-8f86-cc4f5a5cb408-S0\/hduser","items":[{"actio

浏览 4提问于2016-04-28得票数 1

1回答

如何创建跨两个文件的hadoop输入拆分？

hadoop

我的数据输入文件都具有相同的长度，但是，其中的记录可能跨越两个文件(从第一个文件的末尾开始，到第二个文件的开头结束)。创建一组全新的文件以便记录不会跨越多个文件是不是更好？

浏览 0提问于2012-10-29得票数 2

回答已采纳

2回答

在Haoop上UIMA DUCC与UIMA

hadoop、uima、ducc

我正在尝试设计一个基于UIMA的分布式可伸缩管道。我应该如何决定在Hadoop上使用UIMA、DUCC还是UIMA？如果我把它构建在UIMA DUCC而不是Hadoop或者反之亦然，那么我会错过什么呢？

浏览 1提问于2015-04-26得票数 0

回答已采纳

1回答

YARN: Slave DataNode不工作，尽管抬头看起来很健康

hadoop、hadoop-yarn

我在Ubuntu 12.04 LTS上安装了两个节点的Haoop 2.7.1。

浏览 0提问于2015-08-21得票数 0

2回答

正在向我的HDFS写入空文件。

spring、hadoop、stream、spring-xd

因此，我遵循这本书，机器学习手为开发人员写的杰森贝尔。我在这本书中取得了很大的进步，直到我不得不将我的spring流连接到hadoop。我运行的是SpringXD1.2.1，我运行的是hadoop (1.2.1和2.6.0，我都试过了)，它位于端口9000上。在本教程中，我们应该使用twitter流并将其输送到hadoop中的一个文件中，但是当我创建和部署这个流时，它创建的文件并没有填充到tweet中。所以现在，为了让事情变得更简单，我现在只是尝试通过创建这个流来连接到hdfs，但是，当我尝试使用以下命令时，它应该

浏览 3提问于2015-08-09得票数 0

回答已采纳

1回答

如何在Haoop v0.21中调用分区程序

hadoop、mapreduce、hadoop-partitioning

在我的应用程序中，我希望基于键创建尽可能多的reducer作业。现在，我当前的实现将所有键和值写入一个(缩减程序)输出文件中。因此，为了解决这个问题，我使用了一个分区程序，但我不能调用在选择映射任务之后和选择减少任务之前应该调用的class.The分区程序，但它执行了以下分区程序的not.The代码@Override public int getPartition(Text key, Text value, int nbPartitions

浏览 1提问于2011-05-18得票数 1

1回答

用于haoop集成的cassandra客户端是什么？

hadoop、cassandra、thrift、cql3

我试图构建一个数据服务层，使用cassandra作为后端存储。我是卡桑德拉的新手，不知道卡桑德拉-节俭或cql 3的客户是什么？我们有许多使用亚马逊弹性mapreduce (EMR)的mapreduce作业，这些工作将以很大的容量从cassandra读取/写入数据。总数据量将是> 100 TB，在Cassandra中有数十亿行。mapreduce作业可能读或写较重的qps (>1000 qps)。所需经费如下：能够在运行时定义新列。根据应用程序的需求

浏览 1提问于2013-05-01得票数 3

2回答

为Hadoop守护进程选择端口号

hadoop、port、cluster-computing

我的意思是，我参考了"Haoop In Action"，之前的链接和其他网站，每个人似乎都使用了不同的datanode，jobtracker等值。

浏览 0提问于2013-04-26得票数 0

1回答

如何集成/安装开源apache-haoop的Beeline UI编辑器

hadoop、hive、apache-spark-sql、beeline

我们可以为开源hadoop版本配置Beeline UI吗？如果是这样，该怎么做呢？任何网址/文档，请？数据从甲骨文馈送到-->帕奎特，然后Spark处理数据...展望未来，他们希望使用HIVE作为中转区来处理数据。在网上，我发现Beeline可以用来做这个。我需要使用哪个版本？

浏览 0提问于2019-04-09得票数 0

1回答

Hadoop纱上的火花安装

bash、hadoop、apache-spark、hadoop-yarn

请有人帮帮我，我正试图在Haoop Yarn上安装火花，我收到了以下错误： org.apache.spark.SparkException: Yarn application has already ended

浏览 3提问于2015-09-02得票数 1

回答已采纳

1回答

Spark无法读取Hadoop 3中的擦除编码拼图文件

apache-spark、hadoop、pyspark、hadoop3

我已经在这个测试集群上使用"haoop fs - copyFromLocal“和RS-6-3-1024k编码器策略复制了一些拼图格式的文件。

浏览 3提问于2019-08-14得票数 2

2回答

在elasticsearch haoop中合并文档，使用es-sparksql创建多键值对

algorithm、hadoop、elasticsearch-spark

目前，elasticsearch hadoop正在将dataset/rdd转换为具有一对一映射的文档，即将数据集中的一行转换为一个文档。在我们的场景中，我们做的事情如下所示PUT spark/docs/1"_k":"one","_k":"three" // large sets , we dont need to store much, we just want to map multiple keys to single value. &

浏览 0提问于2016-12-28得票数 0

1回答

如何使用JAVA访问Haoop MapReduce中Iterable<DoubleWritable>的第一个元素？

java、hadoop、mapreduce

我正在尝试使用Hadoop MapReduce查找值列表的最小值和最大值，下面是我如何实现我的Reduce代码：正如您所看到的，我在计算"avg"方面没有问题，但是对于"min"和"max"，我知道正确的方法是分配min = "first element of the Iterable<DoubleWritable>"和max = "first element of the Iterable<DoubleWritable>"。我尝试了代码，我已经将其注释掉了，但它们不起作用。因此，我暂时

浏览 0提问于2016-12-05得票数 1

1回答