hadoop停服务器_hadoop 虚拟化部署_hadoop集群部署怎么分主节点 - 腾讯云开发者社区

、、、、

在J2EE项目上，我们使用Wildfly来部署该项目。我们在外部服务器上运行hadoop。我们希望连接此服务器并读取HDFS数据。但问题是，我们使用的任何hadoop库(hadoop-公共库、hadoop-hdfs库、hadoop-客户机库)都需要泽西岛，但野蝇使用Resteasy。由于这种冲突，Wildfly没有成功地部署。我的问题是，是否有不依赖于泽西的hadoop库，我们可以用于此操作，或者，我们需要用泽西岛取代野蝇的Resteasy吗？如果这是解决办法，我们如何才能做到。我们找不到这个解决方案的来源。谢谢你帮忙。

浏览 4提问于2015-07-15得票数 4

回答已采纳

1回答

Hadoop开发环境，你的是什么样子的？

、

我想知道你们的Hadoop开发环境是什么样子的？您是将jars部署到测试集群，还是在本地模式下运行jars？你使用什么IDE，你使用什么插件？如何部署要在服务器上运行的已完成项目？关于设置我自己的Hadoop开发/测试环境，您还有什么其他建议？

浏览 1提问于2010-06-26得票数 2

回答已采纳

2回答

同一台机器上的HBase区域服务器和Hadoop数据节点应该吗？

、

对不起，我没有资源来设置集群来测试它，我只是想知道：我能否将hbase区域服务器部署在除hadoop数据节点机器之外的另一台机器上？我想答案是肯定的，但我不确定。在不同的机器上部署hbase区域服务器和hadoop数据节点是好还是坏？当将一些数据放入hbase中时，这些数据最终存储在数据节点或区域服务器中吗？我猜它是数据节点，但是区域服务器中的StoreFile和HFile是什么，不是用来存储数据的物理文件吗？谢谢!

浏览 9提问于2015-01-06得票数 10

回答已采纳

1回答

纺锤指的是什么？

、、

我正在为正在部署的hadoop集群做非常基本的级别设置。我不熟悉Hadoop或它的一般概念。看一下部署清单，我看到了很多关于纺锤数量和纺锤安装点的讨论。当有人提到一个主轴时，他们是在谈论服务器中物理硬盘驱动器的数量吗？

浏览 1提问于2014-11-10得票数 0

回答已采纳

2回答

如何使Hadoop服务器监听所有IP

、、、、

我正在学习如何在2台机器上部署Hadoop集群，一台主机和一台从机。但是，部署后的web应用服务器(即主机上的端口8088 )是无法访问的。我使用netstat -ant来检查它，如下所示： proto Recv-Q Send-Q LocalAddress ForeignAddress State ... tcp 0 0 127.0.0.1:8088 *:* LISTEN tcp 0 0 0.0.0.0:56666 *:* LISTEN ... 我建立的其他服务器，比

浏览 3提问于2016-03-23得票数 0

回答已采纳

1回答

如何在现有Hadoop2.x中使用spark

、、、

我们已经在服务器上安装了Hadoop2.5。是否可以使用Hadoop部署星火计划？我希望Spark使用现有的Yarn来调度任务，并能够读写现有的HDFS。我怎样才能做到这一点？

浏览 3提问于2015-06-25得票数 0

1回答

我可以使用hadoop运行多个web服务器吗？

我不确定hadoop能做什么和不能做什么，也不知道事情有多容易。据我所知，hadoop擅长做mapreduce工作并提供hdfs，这是他们的分布式文件系统。 hadoop还擅长/容易使用什么？我的问题是:我想提供数据，mapreduce的结果。由于我有很多流量，我需要3个前端服务器。Hadoop能帮助我在3个n个运行节点上部署服务器吗？基本上，我希望在3台机器上运行一个自定义可执行文件(我的服务器)，而不是在n台机器上运行mapreduce。当一台机器发生故障时，hadoop负责在另一台可用机器上启动作业。我应该在hadoop集群上运行这个程序吗？或者，hadoop集群应该只用于map

浏览 3提问于2014-04-01得票数 0

1回答

HBase区域服务器与数据节点的数量

、、

当与Hadoop一起配置HBase集群时，是否可以为每个HDFS数据节点部署一个区域服务器，还是区域服务器和数据节点之间的比率应该与1:1不同？

浏览 3提问于2015-01-08得票数 3

回答已采纳

1回答

从未成功地构建过大型hadoop&spark集群

我想知道是否有人能在使用bdutil工具部署星火集群时帮助我解决这个问题。当核心总数增加(>= 1024)时，它一直失败，原因如下：有些机器是永远不可用的，比如"Tue Dec 8 13:45:14 PST 2015：'hadoop-w-5‘还不能使用(255)；睡眠一些节点在部署火花工作节点时出现“退出100”错误，类似于"Tue Dec 8 15:28:31 PST 2015: Exited 100 : gcloud -project=cs-bwamem-静默-详细=信息计算ssh hadoop-w-6 --command=sudo su -l -

浏览 6提问于2015-12-08得票数 0

2回答

无法为应用程序类com.sun.jersey.api.core.WebAppResourceConfig添加Jersey servlet，因为未在其上设置ApplicationPath批注

、、

当我在Weblogic服务器上部署war文件时，我遇到了jars错误，如何解决Web逻辑服务器中用于网关连接的'Jersey‘和'Hadoop’jar文件错误？我已经附上了日志截图

浏览 4提问于2018-08-17得票数 0

4回答

使用文件还是特定于供应商的？

、

我正在为Hadoop创建一个应用程序，它应该运行在由不同供应商提供的Hadoop的所有发行版上，例如: Cloudera、MapR、Hortonworks、Pivotal...etc。我的应用程序将部署在WebLogic、JBoss等应用服务器上，也可以部署在tomcat上。因此，我在这里的问题是：-假设所有这些供应商的某些版本使用相同的底层hadoop版本，比如Hadoop2.0，那么我应该使用这些供应商提供的JAR文件还是使用Apache提供的JAR文件？我指的是与Apache具有相同类但其名称与blablaCDH5.2blabla.jar，相同的JAR文件，所以我应该使用这个文件还是使

浏览 7提问于2014-11-06得票数 1

回答已采纳

1回答

谷歌云点击部署hadoop

、、、

为什么google cloud click to deploy hadoop工作流程需要选择本地持久磁盘的大小，即使您计划将hadoop连接器用于云存储？默认大小为500 GB。我在想，如果它确实需要一些磁盘，它的大小应该小得多。在google云中使用hadoop云存储连接器时，是否有推荐的持久化磁盘大小？ “在Google Cloud平台上部署Apache Hadoop Apache Hadoop框架支持跨计算机群集的大型数据集的分布式处理。 Hadoop将部署在单个集群中。默认部署创建1个主VM实例和2个工作VM，每个实例具有4个vCPU、15 GB内存和500 GB磁盘。创建一个临时部署

浏览 7提问于2014-11-23得票数 0

1回答

在HBase中部署zookeeper的正确方式是什么？

、

我正在定义我的Hadoop集群的体系结构，我还希望在其中包括Hbase，因此也包括Zookeeper。但是，我不知道相对于hadoop节点，我必须将Zookeeper节点安装在哪里。以下是我的两种可能性第一种可能性：(我的hadoop集群之外的zookeeper集群) 第二种可能性：(我的hadoop集群中的zookeeper集群) 你能告诉我，关于这两种可能性，用HBase部署Zookeeper的正确方式是什么？我还有一个额外的问题: journalNodes和JobHistory服务器是否在正确的位置？我将非常感谢任何帮助，谢谢！

浏览 0提问于2017-03-24得票数 0

1回答

对集群hadoop.security.AccessControlException进行角化

、、、

我正试图对AWS EMR集群进行切割。我启用了hadoop安全性，创建了kerberos主体，并将它们部署到所有节点上。但是，当我使用命令'sudo start hadoop-‘启动namenode时，会引发以下异常。 2016-06-08 :14:06,515 INFO org.apache.hadoop.hdfs.server.blockmanagement.DatanodeDescriptor (主)：失败存储更改数量从0到0 2016-06-08 :14:06,515 INFO org.apache.hadoop.hdfs.security.token.block.Bloc

浏览 2提问于2016-06-08得票数 1

回答已采纳

2回答

SparkPi程序在Yarn/Spark/下继续运行

、、、、

在Google引擎上部署了一个Hadoop (Yarn + Spark)集群，其中包含一个主服务器和两个从服务器。当我运行以下shell脚本时： /home/hadoop/spark-install/lib/spark-examples-1.1.0-hadoop2.4.0.jar 火花-提交-类org.apache.spark.examples.SparkPi -主纱线-机群-num-执行器1-驱动器-内存1g -执行器-内存1g -执行器-芯1 org.apache.spark.examples.SparkPi 10 作业一直在运行&每一秒我都会收到一条类似于以下内容的消息： 15

浏览 3提问于2015-02-06得票数 1

1回答

HBase客户端在JBoss下不能作为7.1工作

、、、、

我有一个JBoss应用程序，它需要与HBase服务器进行远程对话。当使用简单控制台项目时，HBase客户端工作得很好，但是当部署在JBoss服务器上时，看起来服务器并没有加载类JBoss有人能帮上忙吗？非常感谢你的答复。 org.apache.hadoop.hdfs.web.resources.UserProvider 错误消息 ERROR StandardWrapper.Throwable: java.lang.RuntimeException: java.lang.ClassNotFoundException: java.lang.ClassNotFoundException 列表ja

浏览 4提问于2014-01-15得票数 5

1回答

如何部署星火，使其资源利用率最高

、、、、

我有10个服务器(16G内存，8个核心)，想要部署Hadoop和Spark，您能告诉我哪一个计划可以最大限度地利用资源吗？立即部署；安装Openstack，将环境部署到虚拟机中；使用码头，如码头上的火花；我知道与使用场景相关的资源利用率，实际上我想知道上述三种计划的优缺点。谢谢。

浏览 3提问于2014-10-07得票数 0

2回答

如何将蜂箱连接到桌面上？

、、、

我已经部署了一个自定义的多节点hadoop集群，其中包含两个从服务器和一个主服务器，并将数据存储在蜂窝表中。如何将蜂箱连接到tableau以实现可视化？任何帮助都将不胜感激。谢谢

浏览 4提问于2017-03-21得票数 0

回答已采纳

1回答

C# Process cmd.exe - 'hadoop‘不被识别为内部或外部命令、可操作的程序或批处理文件。

、、、

好吧，我先给你讲讲上下文。我在IIS 7中部署了一个网站。在服务器上，安装了windows Mapr客户端。这使我可以访问windows系统上的hadoop集群。() 我已经登录并检查hadoop客户端是否正常工作。所以现在问题是。我正在使用C#进程和ProcessStartInfo类打开一个cmd.exe实例，在那里我从hadoop服务器获取文件并使其在UI上可访问。(hadoop fs -get .)。但出于某种原因，我从process.StandardError收集的错误返回以下错误： 'hadoop‘不被识别为内部或外部命令、可操作的程序或批处理文件

浏览 6提问于2015-03-23得票数 1

1回答

如何从android呼叫服务器ip地址

、

我必须在android中编写代码，以便创建一个调用hadoop集群节点的应用程序。我有一个相同的ip地址，我可以通过putty在我的windows机器上登录。我不知道如何从我的android应用程序呼叫该服务器？以及如何运行部署在hadoop节点上的可执行jar文件。任何指南或示例代码片段都将是一个很大的帮助。提前感谢Manu Misra

浏览 1提问于2012-08-27得票数 0

回答已采纳

1回答

如何在hadoop2中使用JobClient (纱线)

、、

在hadoop1中，我可以使用JobClient (本地伪分布式模式，使用Eclipse)： JobClient jobClient = new JobClient(new InetSocketAddress("127.0.0.1",9001),new JobConf(config)); JobID job_id = JobID.forName("job_xxxxxx"); RunningJob job = jobClient.getJob(job_id); ..... 今天我设置了一个pesudo分布式hadoop2纱线集群，然而，上面的代码不起作用。我使用

浏览 2提问于2014-08-01得票数 1

2回答

为什么bash循环部署脚本似乎只工作一次？

、

我有几个简单的脚本，它们用菊花链连接在一起，在一个文件中列出的一组服务器上运行一个特定的脚本，每行一个。单个服务器部署脚本包含以下内容： 1 #!/bin/bash 2 3 file=$1 4 host=$2 5 6 scp ${file} ${host}:/tmp/ 7 USER=`whoami` 8 ssh -t -t $USER@${host} /tmp/${file} 9 10 ssh "${host}" /bin/rm /tmp/${file} 11 exit 它在我有一个脚本上运行得很好，那就是yum安装tomcat并

浏览 4提问于2010-04-13得票数 0

回答已采纳

4回答

Kubernetes对标准Hadoop的Hadoop

、

在Kubernetes上Hadoop和标准Hadoop有什么区别？在Kubernetes上部署Hadoop有什么好处？

浏览 0提问于2018-11-26得票数 11

回答已采纳

2回答

弹簧、数据流和纱线:如何正确设置属性？

、、、

怎样才能更改默认的appdeployappmaster属性？当我试图通过Spring DataFlow纱线部署应用程序时。我注册了我的应用程序，创建了一个流，然后点击“部署”按钮。这样做时，我会得到以下错误： XNIO-2任务-2警告o.s.c.d.s.c.StreamDeploymentController -异常时部署应用程序StreamAppDefinition streamName=histo，name=my- app，registeredAppName=my-app，java.util.concurrent.ExecutionException: org.springframew

浏览 5提问于2016-12-01得票数 0

回答已采纳

1回答

如何为已存在的Hadoop集群部署FreeSWITCH

、、、、

我计划在Hadoop集群的帮助下平衡注册和邀请FreeSWITCH的任务负载，所以我的问题如下：我想知道是否可以为现有的Hadoop集群部署FreeSWITCH。如果没有，请跳到第三个问题。如何配置和部署FreeSWITCH。对于FreeSWITCH的负载平衡还有其他解决方案吗？ PS:我的Hadoop集群由vmware构建在虚拟mathine上，操作系统是Ubuntu 14.04、Hadoop-2.6、HBase-0.98、动物园管理员-3.6、FreeSWITCH-1.4.14。

浏览 2提问于2015-04-15得票数 0

1回答

我应该在物理机器或虚拟机上部署hadoop吗？

、、

我们将在数百个(比如300个)物理x86节点上部署一个hadoop集群。由于我们没有太多的生产部署经验，有一个简单的问题，作为标题，我们希望听到有经验的人的反应。最好的治疗方法是什么？我们应该直接在物理盒上部署hadoop，还是需要一个虚拟机层(即IaaS云)来管理hadoop集群的计算资源。在做这个决定的时候，应该注意什么？

浏览 0提问于2015-04-23得票数 2

回答已采纳

2回答

如何分别为HDFS指定一组节点，为MapReduce作业指定其他节点？

、

在部署hadoop时，我希望一些节点可以运行HDFS服务器，而不是运行任何MapReduce任务。例如，有两个节点A和B运行HDFS。我希望将节点A排除在运行任何map/还原任务之外。我怎样才能做到这一点？谢谢

浏览 4提问于2017-01-24得票数 3

回答已采纳

2回答

Spark on Yarn发送RPC和Slave lost失败

、、

我想在Yarn上部署spark2.3.2，Hadoop2.7.3。但是当我运行的时候： spark-shell 始终引发错误： ERROR TransportClient:233 - Failed to send RPC 4858956348523471318 to /10.20.42.194:54288: java.nio.channels.ClosedChannelException ... ERROR YarnScheduler:70 - Lost executor 1 on dc002: Slave lost dc002和dc003都会引发错误Failed to send RPC和S

浏览 0提问于2019-02-20得票数 3

1回答

在Google中维护持久的HDFS

、、

我让我的学生使用bdutil创建一个Google集群，将持久磁盘和HDFS作为默认文件系统。我们希望有持久化磁盘，这样学生们就可以在几个星期内完成项目。但是，在我重新部署集群之后，HDFS似乎无法使用。我的问题是“如何在集群的重新部署中维护持久的HDFS文件系统？” 这是我尝试过的在创建持久磁盘的初始部署中，一切都运行良好。我用命令创建一个目录 $ hadoop fs -mkdir /foo $ hadoop fs –put foo.txt /foo/foo.txt $ hadoop fs –cat /foo/foo.txt foo 然后，我使用DELETE_ATTACHED_PDS_ON

浏览 3提问于2014-10-01得票数 1

回答已采纳

3回答

Hadoop生态系统部署步骤

、、、、

我正在尝试将Apache Hadoop堆栈中的所有项目设置在一个集群中。设置apache hadoop生态系统框架的顺序是什么。例如: Hadoop，HBase，...如果您使用一组特定的步骤进行了测试，那么您能告诉我们在部署过程中可能会遇到哪些问题吗？主要的部署框架(Hadoop，HBase，Pig，Hive，HCatalog，Mahout，Giraph，ZooKeeper，Oozie，avro，sqoop，mrunit，crunch，如果我遗漏了什么，请添加)

浏览 0提问于2012-05-11得票数 1

回答已采纳

1回答

如何在hadoop集群上为Google计算引擎启用Snappy/Snappy Codec

、、、、

我试图在上运行Hadoop作业，以处理我们的压缩数据，该数据位于上。在尝试通过SequenceFileInputFormat读取数据时，我得到以下异常： hadoop@hadoop-m:/home/salikeeno$ hadoop jar ${JAR} ${PROJECT} ${OUTPUT_TABLE} 14/08/21 19:56:00 INFO jaws.JawsApp: Using export bucket 'askbuckerthroughhadoop' as specified in 'mapred.bq.gcs.bucket' 14/08/21

浏览 3提问于2014-08-21得票数 2

回答已采纳

2回答

Apache演习是否会对现有Hadoop集群中的Hadoop生态系统的其他成员产生负面影响？

、、、、

如果我在现有Hadoop集群中部署Apache Drill，Apache Drill是否会对现有Hadoop集群中Hadoop生态系统的其他成员产生负面影响？

浏览 3提问于2016-06-28得票数 0

1回答

通过Jenkins部署Oozie作业

、、、

我正在编写Oozie作业，我想将它们部署到hadoop集群中。但是，我不想手动执行这些操作，而是希望使用Jenkins为我执行此部署。我在网上搜索，没有找到任何的插件.因此，如果在hadoop集群上使用oozie，请告诉我使用Jenkins进行自动构建和部署的最佳方法是什么？

浏览 3提问于2016-01-14得票数 3

回答已采纳

1回答

在非集群计算机上编译Hadoop MapReduce并在Hadoop集群上运行。

、、、、

我已经阅读了很多关于Hadoop的文档和信息，但是我不知道如何实现这个简单的工作流：我想在我的工作机器上用Hadoop开发和编译 Hadoop MapReduce，包括所有已安装的IDE等等。我希望以最简单的方式将部署并在Hadoop集群上运行MapReduce作业(更好地使用IDE) 我希望能够将这些MapReduce作业集成到外部应用程序中，并能够透明地运行它们。看起来，所有的开发/编译/运行都应该在存在bin/hadoop命令行实用程序和Hadoop库的MasterNode上完成。我说的对吗？开发、运行和部署MapReduce应用程序的一般方法是什么？是否有某

浏览 4提问于2016-01-04得票数 0

回答已采纳

1回答

VM上的Ambari部署问题

、、、

我正致力于在我们的企业中建立一个生产Hadoop/Spark集群，但我首先要做一些测试。为了得到一些语义学：生产操作系统: RHEL 7 CPU: 8核RAM: 64 12节点数:12类型: VMs 这些生产节点都是VM，给出了1tb的数据空间，这是/ data /的挂载。每个系统目录都有自己的文件系统，例如/var/有自己的文件系统，/usr/ and /有自己的文件系统，并且在大小/空间上受到限制。因此，我正在确定每个文件系统需要多少才能完成一个完整的堆栈安装。我过会儿再谈这个。现在，我正在DEV盒上测试这一点，我有一个框设置作为管理节点，另一个框作为部署节点。我在这里的目标是测试对单

浏览 1提问于2017-08-29得票数 0

回答已采纳

1回答

在OpenStack之上的Hadoop，我得到了哪些额外的特性？

、、

我想为数据分析目的部署一个小型数据中心。我将主要从web应用程序中获取数据。我知道我可以设置hadoop集群并根据需要进行扩展。我还知道，OpenStack是一个免费的、开源的云计算软件平台，主要作为服务基础设施(IaaS)部署。然而，很明显，一些行业更喜欢在OpenStack (撒哈拉沙漠)之上的hadoop。因此，我想知道有或没有OpenStack的Hadoop的区别、优缺点。简单地说，如果我将Hadoop放在OpenStack之上，我会得到哪些额外的特性？

浏览 0提问于2015-12-18得票数 0

回答已采纳

1回答

是否有一个可以推送大量数据的框架？

我们的MySQL和Hadoop平台部署在不同的网络中，Hadoop不能访问MySQL，但是MySQL可以连接到Hadoop。那么，是否有一个工具可以像Sqoop获取数据那样将大量数据从RDS推送到HDFS？或者有没有其他方法可以解决这个问题？任何帮助都是非常感谢的。顺便说一句，Hadoop集群在我们的网络中使用了一个Kafka主题，通过在两边部署水槽并连接在一起。但是对于海量的RDS数据，如何实现这一点呢？

浏览 1提问于2019-02-20得票数 0

1回答

从Hadoop访问只读的Google存储桶

、、、、

我正在尝试使用bdutil脚本从部署在Google中的Hadoop集群中访问Google。如果存储桶访问是只读的，则失败。我在做什么：将集群部署到部署-e datastore_env.sh 关于主人： vgorelik@vgorelik- hadoop -m:~$ hadoop fs -ls gs://pgp- 2>&1 -data -10 14/08/14 :10 14/08/ 14 :34:21 INFO gcs.GoogleHadoopFileSystemBase: GHFS版本:1.2.8-hadoop 1 14/08/14 14:34:25警告gcsio.

浏览 2提问于2014-08-14得票数 5

1回答

如何指定在提交Spark应用程序时从HDFS读取数据的位置？

、

我一直试图在三台机器(主、slave1和slave2)上部署一个火花多节点集群。我已经成功地部署了spark集群，但是对于如何在从服务器上分发我的HDFS数据感到困惑吗？是否需要手动将数据放在从节点上，以及如何指定从客户端提交应用程序时从何处读取数据？我已经搜索了多个论坛，但没有找到如何在没有使用Hadoop的情况下使用HDFS与Spark。

浏览 0提问于2017-12-03得票数 0

回答已采纳

1回答

安装hadoop-cdh后缺少/etc/init.d/下面的Init脚本

、

在Cloudera的文档中--“在集群上部署HDFS (使用命令行)” 据说，要启动namenode服务，输入以下命令： for x in `cd /etc/init.d ; ls hadoop-hdfs-*` ; do sudo service $x start ; done 问题是，在hadoop-hdfs-*目录下没有匹配/etc/init.d/名称模式的项。我认为应该有一个hadoop-，不是吗？有人能告诉我为什么会丢失吗？我错过了什么部署步骤吗？非常感谢!

浏览 1提问于2017-10-06得票数 0

回答已采纳

4回答

单击此按钮在GCE上部署Hadoop不起作用

我正在尝试“在Google上点击部署Hadoop” 不幸的是，这似乎行不通:要么进程几乎立即停止，要么就像被冻结了一样。显示的消息是部署可能需要3到10分钟才能完成，这取决于创建部署的集群的大小。无论如何，我不能有任何集群。尝试了几个区域，Hadoop版本，什么都没有。有什么想法吗？

浏览 5提问于2014-10-22得票数 0

回答已采纳

2回答

如何仅使用java API访问安全的kerberized

、、、、

我是Kerberos的新手。我正在使用一个共享的Hadoop集群。我的管理员为我提供了用户名和密码以及KDC服务器的位置。是否可以仅使用JAVA GSS API和Hadoop USerGroupInformation类来访问Hadoop集群。对于非kerberos hadoop集群，这是我用来从HDFS读取文件的代码片段： String uname = <Some username>; UserGroupInformation ugi = UserGroupInformation.createRemoteUser(uname); ugi.doAs(new PrivilegedE

浏览 0提问于2014-01-18得票数 3

2回答

判断hadoop集群中的从节点是否分配了任务

、

我是Hadoop和MapReduce的新手。我刚刚部署了一个Hadoop集群，其中有一台主机和32台从机。然而，当我开始运行一个示例程序时，它似乎只是运行得很慢。如何确定map/reduce任务是否真的被分配到从节点执行？示例程序的执行方式如下： hadoop jar ${HADOOP_HOME}/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar pi 32 100

浏览 0提问于2016-03-14得票数 1

2回答

猪与猪在局部模式上的差异

、、、、

我想知道，如果我在本地模式下使用pig (在内部称为Map )而使用PIG-withouthadoop.jar文件，那么性能的增益或损失是什么？真的不使用hadoop吗？如果我只想使用没有集群的Pig，比如设计数据流，那么我应该使用什么呢？本地模式的猪还是带有outhadoop.jar文件的猪？目前，我已经使用pig本地模式编写了我的脚本，在尝试在服务器中部署和在本地模式下设置HADOOP_HOME时，我认为在设置PIG_HOME变量之前，还需要在环境变量中设置PIG_HOME。好建议..。提前谢谢。:)

浏览 2提问于2015-03-30得票数 0

回答已采纳

1回答

Hadoop CDH.只能将文件复制到0节点，而不是minReplication (=1)

、、、

我对72台机器的集群有异议。其中60台是冷库，12台是冷库。当我试图将数据放入冷蜂巢表(，有时是)时，我得到了一个错误： Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /user/hive/warehouse/test.db/rawlogs/dt=2016-01-31/.hive-staging_hive_2016-06-29_12-54-09_949_6553181118480369018

浏览 1提问于2016-06-29得票数 1

2回答

如何将从jenkins构建的文件或jar文件复制到不同的主机服务器

、、

我有一个jenkins的工作，其中我正在构建一个jar文件。构建完成后，我需要将该jar文件复制到另一台服务器并将其部署到那里。我正在尝试这个yml文件来实现相同的功能，但是它在不同的服务器而不是jenkins服务器中查找该文件。 --- # ansible_ssh_private_key_file: "{{inventory_dir}}/private_key" - hosts: host remote_user: xuser tasks: - service: name=nginx state=started become: yes

浏览 0提问于2017-05-23得票数 0

1回答

在MapReduce Servlet上从动态WildFly项目运行Hadoop WildFly作业

、、、、

我已经将Hadoop 2.2.0安装在ubuntu13.10上，在我的pc上以伪分布式模式启动并正确运行(只有一个datanode)。我使用EclipseKeplerv4.3和Maven插件来开发我的Hadoop程序和动态without (项目没有Maven)。我有一个名为"HadWork“的Hadoop项目，我用它创建了HadWork.jar (右键单击项目、导出、运行的Jar文件，并选择”将所需的库提取到生成的JAR")。当从命令行运行作业时，它可以正常工作："Hadoop HadWork.jar parameter1 parameter2 parameter3“

浏览 3提问于2014-03-24得票数 0

回答已采纳

1回答

Jenkins复制到hdfs

、、、

我已经为Jenkins尝试过几个工件插件，但到目前为止，任务没有成功：我使用hadoop作为文件系统进行部署，并从hadoop部署我的应用程序(mesos/马拉松只能访问http或hdfs)。如何使Jenkins保存从sbt到hdfs的工件压缩？我没有给我运行doesnt命令的选项

浏览 2提问于2014-12-11得票数 2

回答已采纳

2回答

强迫纱线在所有奴隶中部署火种任务

、、、

我一直在一个8节点集群上部署SparkPi示例。似乎与示例相关的任务并没有部署到集群中的所有节点，即使集群没有得到充分利用(没有运行其他作业)。下面是我如何启动SparkPi示例： spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster --driver-memory 1g --executor-memory 1g --executor-cores 1 --num-executors 7 $SPARK_HOME/lib/spark-examples-1.6.1-had

浏览 4提问于2016-05-13得票数 3

2回答

中型Hadoop /星火集群管理

、、、

请告诉我，这个问题是否更适合于不同的通道，但我想知道推荐的工具是什么，以便能够在大量远程服务器上安装、配置和部署hadoop/spark。我已经熟悉了如何安装所有的软件，但我正在努力确定我应该开始使用什么，这将使我能够轻松地跨大量服务器部署。我已经开始研究配置管理工具了。厨师，木偶，ansible)，但想知道什么是最好的和最友好的用户开始选择是在那里。我也不想使用火花-EC2。我应该创建本地脚本来遍历包含IP的主机文件吗？我应该用pssh吗？pscp？等等，我只想能够使用尽可能多的服务器，并安装所有的软件。

浏览 1提问于2016-09-10得票数 0

回答已采纳