在Hadoop中使用sparklyr时出现权限错误_使用spark-submit时出现Hadoop错误_在Hadoop中使用DistributedCache时出现异常 - 腾讯云开发者社区

r、apache-spark、sparklyr

我试着用Sparklyr把R和火花连接起来。我遵循了rstudio博客的教程我试着安装sparklyr install.packages("sparklyr")运行良好，但在另一篇文章中，我发现sparklyr_0.4版本中有一个bug。因此，我按照下面的说明下载开发版本，使用 devtools::install_github("rstudio/sparklyr")也很好，现在我的sparklyr版本是sparklyr_0.4.16。我按照rstudio教程下载并安装spark spark_install(version = "1.

浏览 9提问于2016-10-17得票数 5

回答已采纳

1回答

闪烁+闪烁:连接到集群时出错

r、hadoop、apache-spark、sparklyr、sparkling-water

有一段时间，我使用sparklyr包连接到公司Hadoop集群，使用以下代码： library(sparklyr) Sys.setenv(SPARK_HOME="/opt/spark/") Sys.setenv(HADOOP_CONF_DIR="/etc/hadoop/conf.cloudera.yarn") Sys.setenv(JAVA_HOME="/usr/lib/jvm/jre") system('kinit -k -t user.keytab user@xyz') sc <- spark_connect(ma

浏览 0提问于2017-02-14得票数 1

1回答

连接到sessionid的端口(8880)时，sparklyr失败

sparkr

强制错误(代码)：连接到sessionid (2044)的端口(8880)时失败:端口(8880)中的网关没有响应。路径: C:\Users\user1\AppData\Local\rstudio\spark\Cache\spark-1.6.2-bin-hadoop2.6\bin\spark-submit2.cmd参数：-- "D:\Users\user1\R\R-3.3.1\library\sparklyr\java\sparklyr-1.6-2.10.jar"，，sparklyr.Backend，--packages，"com.databricks:spark-cs

浏览 0提问于2016-11-03得票数 1

1回答

"C:\Users\username\AppData\Local\spark\spark-2.3.3-bin-hadoop2.7\tmp\local\spark-..\userFiles目录下spark_apply无法运行程序“Rscript”

r、apache-spark、sparklyr

按照“掌握Apache”一书关于spark_apply的第一个说明，在windows下的本地集群上并使用RGui启动： install.packages("sparklyr") install.packages("pkgconfig") spark_install("2.3") Installing Spark 2.3.3 for Hadoop 2.7 or later. spark_installed_versions() library(dplyr,sparklyr) sc <- spark_connect(master = "

浏览 8提问于2019-10-24得票数 1

回答已采纳

1回答

Sparklyr无法从Dockerfile中的apache下载Spark

r、docker、apache-spark、sparklyr

我正在尝试创建一个dockerfile，它构建了来自Rocker/tidyverse的图像，并包含了来自sparklyr的Spark。之前，在这篇文章中：，我试图弄清楚为什么spark不能从我的dockerfile下载。在玩了5天后，我想我找到了原因，但不知道如何修复它。这是我的Dockerfile： # start with the most up-to-date tidyverse image as the base image FROM rocker/tidyverse:latest # install openjdk 8 (Java) RUN apt-get update \

浏览 4提问于2021-02-16得票数 1

3回答

hadoop单节点设置bash: bin/hadoop权限被拒绝

hadoop

在格式化namenode的步骤中尝试设置单节点hadoop集群时出现错误。命令： bin/hadoop namenode -format 错误： bash: bin/hadoop : permission denied 我在ubuntu 12.10，12.04，11.04上试了一下，都得到了同样的错误。我能做什么?

浏览 0提问于2012-12-18得票数 0

回答已采纳

1回答

Sparklyr:使用调用方法列出R中目录的内容

r、apache-spark、sparklyr

无法通过Spark找到内置用于列出目录内容的sparklyr，我正在尝试使用invoke sc <- spark_connect(master = "yarn", config=config) path <- 'gs:// ***path to bucket on google cloud*** ' spath <- sparklyr::invoke_new(sc, 'org.apache.hadoop.fs.Path', path) fs <- sparklyr::invoke(spath, 'getFileS

浏览 2提问于2018-10-22得票数 3

回答已采纳

1回答

无法通过sparklyr连接到独立spark集群。如何调试？

apache-spark、sparklyr

我可以确认使用spark-shell连接到群集，例如 spark-shell --master spark://myurl:7077 作品但 library(sparklyr) sc <- spark_connect( master="spark://myurl:7077", spark_home = "d:/spark/spark-2.4.4-bin-hadoop2.7/" ) 不会并给出错误 Error in force(code) : Failed while connecting to sparklyr to port (8

浏览 13提问于2019-10-09得票数 0

1回答

在Windows上安装sparklyr

r、hadoop、apache-spark、sparkr、sparklyr

我尝试过几个关于在Windows环境中设置Spark和Hadoop的教程，特别是在R. 旁边，在我访问图9时导致了这个错误：也给了我一些问题。当我到达 sc <- spark_connect(master = "local") 步骤，我得到了一个熟悉的错误： Error in force(code) : Failed while connecting to sparklyr to port (8880) for sessionid (1652): Gateway in port (8880) did not respond. Path: C:\U

浏览 0提问于2016-11-16得票数 4

回答已采纳

1回答

使用sparklyr包安装spark时出错

sparklyr

我正在尝试在Mac系统(macOS Catalina)上安装sparklyr；当运行spark_install()时，它开始下载软件包，然后失败。请参考以下代码进行重现。 > library(sparklyr) > packageVersion("sparklyr") [1] ‘1.5.2’ > system("java -version") java version "15.0.2" 2021-01-19 Java(TM) SE Runtime Environment (build 15.0.2+7-27) Java Hot

浏览 62提问于2021-02-12得票数 2

回答已采纳

2回答

火花-安装后出错

r、apache-spark、sparklyr

我很高兴能轻松地安装sparklyr。 spark_install(version = "2.1.0", hadoop_version = "2.7") 安装完成。但是在安装之后，我想连接spark，我得到了下面的错误消息。文件夹C:/spark不存在，因为RStudio在我的用户下面安装了spark命令。 > sc <- spark_connect(master = "local") 在spark_version_from_home(spark_home，default = spark_version)中的C:\spa

浏览 3提问于2017-05-19得票数 1

回答已采纳

1回答

在Hadoop中使用sparklyr时出现权限错误

apache-spark、hadoop、sparklyr

我正在尝试让sparklyr在使用Hadoop的集群上工作。当我运行sc <- spark_connect(master = "yarn-client", version = "2.8.5")时我收到这个错误消息： Error in force(code) : Failed during initialize_connection: org.apache.hadoop.security.AccessControlException: Permission denied: user=rstudio, access=WRITE, inode="

浏览 27提问于2019-09-27得票数 1

回答已采纳

1回答

无法通过sparklyr连接到Spark

r、apache-spark、sparklyr

我正在尝试使用R中的sparklyr包连接到spark，我得到了以下错误： library(sparklyr) > library(dplyr) > config <- spark_config() > config[["sparklyr.shell.conf"]] <- "spark.driver.extraJavaOptions=-XX:MaxHeapSize=4g" > sc <- spark_connect(master = "local",version = "1.6.2&

浏览 13提问于2017-01-25得票数 0

1回答

使用sparklyr软件包试图连接到Rstudio中的星火时出错

apache-spark、rstudio

我使用下面的命令连接到来自rstudio的星星之火： sc <- spark_connect(master = "local"，version = "2.0.0") 我尝试过更改java版本/路径，但仍然遇到了同样的问题。有人能帮忙吗？生效错误(代码)：当连接到sparklyr到端口(8880)时失败，用于会话did (5308)：端口中的网关(8880)没有响应。 Path: C:\Users\....\Local\rstudio\spark\Cache\spark-2.0.0-bin-hadoop2.7\bin\spark-submit2.c

浏览 2提问于2017-07-10得票数 0

1回答

使用spark_read_csv()从Rstudio服务器中的Azure Blob存储中读取CSV文件

apache-spark、rstudio、sparklyr、rstudio-server

我已经在Spark 2.2上配置了Azure HDInsight集群类型的ML服务(R服务器)，操作系统Linux，版本ML服务9.3，使用Java8HDI3.6。在Rstudio服务器中，我正在尝试从我的blob存储中读取csv文件。 Sys.setenv(SPARK_HOME="/usr/hdp/current/spark-client") Sys.setenv(YARN_CONF_DIR="/etc/hadoop/conf") Sys.setenv(HADOOP_CONF_DIR="/etc/hadoop/conf") Sys.seten

浏览 0提问于2018-11-13得票数 0

1回答

将spark升级到2.3.0后，我发现RequestHedgingRMFailoverProxyProvider not found

apache-spark

我刚刚将Spark从2.1.1升级到2.3.0，当我在Yarn客户端模式下运行spark查询时，我得到了以下错误。请谁来帮帮忙。强制错误(代码)： Failed during initialize_connection: java.lang.RuntimeException: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.yarn.client.RequestHedgingRMFailoverProxyProvider not found 20/05/07

浏览 89提问于2020-05-08得票数 0

1回答

使用SparkR的Sparklyr :解析函数参数的困难

r、sparkr、sparklyr

我正在运行Sparklyr和SparkR。当我试图使用由schema()创建的数据表调用spark_read_csv()函数时，会收到以下错误(以及select()和lapply()函数上的类似错误)：错误in (函数(类、fdef、mtable)：无法找到用于签名“tbl_spark”的函数“schema”的继承方法以下是我的版本信息： R版本3.5.3 (2019-03-11) 平台:x86_64-W64-mingw32 32/x64(64位) 运行于: Windows >= 2012 x64 (build 9200) ..。其他随附包裹:1 sparklyr

浏览 1提问于2019-04-14得票数 0

1回答

码头(HDFS，火花，闪亮R)

r、docker、hadoop、shiny、hdfs

我在同一个网络中有3个容器:一个Hadoop容器，一个火花容器和一个闪亮的R容器我想从我闪亮的应用程序中读取HDFS上的文件夹。如果Hadoop、Spark和闪亮R位于同一服务器(没有Docker容器)，我可以使用以下方法： system(paste0("hdfs dfs -ls ", "/"), intern = TRUE) 如果我使用的码头容器中Hadoop和闪亮R是在不同的容器，我不能这样做： system(paste0("hdfs dfs -ls ", "/"), intern = TRUE) 因为他们是独立的。你知道

浏览 1提问于2019-09-23得票数 0

回答已采纳

2回答

sparklyr -连接远程hadoop群集

r、apache-spark、sparklyr

可以将sparklyr连接到远程hadoop集群，还是只能在本地使用？如果可能，如何实现？:) 在我看来，通过spark从R到hadoop的连接非常重要！

浏览 0提问于2017-05-19得票数 1

2回答

从Windows启动Spark-Shell (Scala)并设置工作目录路径

windows、scala、apache-spark、command-line

我已经使用RStudio的sparklyr包安装了Spark，并通过以下方式返回路径： # library(sparklyr) # spark_home_dir() 现在我想从Windows command shell启动spark-shell，这很好用。 start C:\\Users\\eyeOfTheStorm\\AppData\\Local\\rstudio\\spark\\Cache\\spark-2.0.0-bin-hadoop2.7\\bin\\spark-shell 但是，当我尝试将工作目录设置到我的桌面上，以便可以从那里读取文件时，使用:load指向工作目录时，它不能正确指向

浏览 1提问于2016-12-12得票数 0

4回答

通过sparklyr将R连接到Spark

r、apache-spark、sparklyr

我正在尝试按照来自RStudio：的sparklyr教程将R连接到Spark 但是，我收到了一个奇怪的错误消息，如下所示。有人知道如何解决这个问题吗？我曾尝试将C:\Windows\system32路径添加到系统变量path中，但没有成功。谢谢你的帮助。 > library(sparklyr) > sc <- spark_connect(master = "local") Error in sparkapi::start_shell(master = master, spark_home = spark_home, : Failed to launch

浏览 2提问于2016-07-21得票数 0

1回答

使用sparklyr删除/更新分区

r、hadoop、apache-spark、sparklyr、hadoop-partitioning

我使用sparklyr的spark_write_table函数将表写入到HDFS中，并使用partition_by参数定义如何存储它们： R> my_table %>% spark_write_table(., path="mytable", mode="append", partition_by=c("col1", "col2") ) 但是，现在我想通过只更改一个分区来更新表，而不是再次写入整个表。在H

浏览 0提问于2018-01-26得票数 2

2回答

Sparklyr连接到S3桶抛出错误

r、apache-spark、amazon-s3、sparklyr

我试图连接到S3桶从R火花。我能够读取本地文件的火花上下文。然而，试图连接s3似乎是一个问题，抛出大量错误。下面是使用的代码列表。注意:单个s3桶有多个遵循相同模式的csv文件。 library( sparklyr ) library( tidyverse ) sparklyr :: spark_install ( version = "2.0.2" , hadoop_version = "2.7" ) sparklyr::spark_install( version = "2.0.2" , hadoop_version = "2.

浏览 2提问于2017-07-19得票数 3

回答已采纳

3回答

sparklyr将数据写入hdfs或配置单元

sparklyr

我尝试使用sparklyr将数据写入hdfs或hive，但无法找到方法。是否有可能使用sparklyr将R数据帧写入hdfs或hive？请注意，我的R和hadoop运行在两个不同的服务器上，因此我需要一种从R写入远程hdfs的方法。向Rahul致敬

浏览 16提问于2017-06-28得票数 6

3回答

通过sparklyr连接到s3存储桶时出现签名错误

r、amazon-web-services、hadoop、amazon-s3、sparklyr

尝试使用sparklyr从R studio连接到s3存储桶时遇到错误。s3存储桶位于eu-central-1(法兰克福)区域。Spark版本- 2.1.0，Hadoop 2.7。我收到带有签名不匹配错误的403响应代码。然而，当我尝试获取一个s3a存储桶时，我得到了一个400响应代码。任何关于通过R studio中的spark连接到s3存储桶的替代方法的话，也都会受到欢迎。与s3的连接在没有Spark的情况下工作得很好。这是代码， # install.packages("devtools") # devtools::install_github("rstudio

浏览 0提问于2017-11-29得票数 1

1回答

连接R与星火在Rstudio-失败启动火花外壳。端口文件不存在

r、apache-spark、rstudio、sparkapi、sparklyr

我正在尝试使用Rstudio将R与星火的本地实例连接起来。但是，我得到了显示的错误消息。我遗漏了什么？我正在使用windows 10，我正在学习关于的教程。 library(sparklyr) spark_install(version = "1.6.1") library(sparklyr) library(dplyr) sc <- spark_connect(master = "local") 我收到的错误消息是： Error in start_shell(scon, list(), jars, packages) :

浏览 2提问于2016-07-05得票数 3

回答已采纳

1回答

Spark中大表上的sparklyr sdf_collect和dplyr collect函数需要很长时间才能运行？

r、apache-spark、dplyr、tidyverse、sparklyr

我正在运行R Studio和R 3.5.2。我已经使用来自S3a的sparklyr::spark_read_parquet加载了大约250个parquet文件。我需要从Spark (由sparklyr安装)收集数据： spark_install(version = "2.3.2", hadoop_version = "2.7") 但由于某些原因，这项工作需要很长时间才能完成。有时将任务分配给所有CPU，有时只有一个CPU工作： ? 请建议您如何解决dplyr::collect或sparklyr::sdf_collect的“运行年龄”问题。也请理解，我

浏览 39提问于2019-01-28得票数 1

回答已采纳

1回答

无法启动Hadoop的单节点集群

hadoop

我正在尝试在hadoop 2.9.1上安装ubuntu 19.10，并且完成了在这个视频https://www.youtube.com/watch?v=Y6oit3rCsZo中解释的所有步骤。问题是，当我尝试使用以下命令启动单个节点集群时： hduser@-ubuntu:~$ start-dfs.sh 我知道这个错误： localhost: chown:修改‘/usr/local/hadoop-2.9.1/log’的所有者:不允许操作我搜索并找到了一些在在Hadoop中启动单个节点集群时出现的“拒绝权限”错误中给出的解决方案在namenode不跑..。我已经尝试过sudo chown -

浏览 0提问于2020-04-16得票数 0

回答已采纳

1回答

如何使用IAM角色身份验证从EC2上的RStudio访问S3数据？

r、amazon-web-services、amazon-s3、amazon-ec2、sparklyr

我在一个EC2实例上运行RStudio，该实例具有一个关联的IAM角色，允许对它进行完全的S3访问。我想将一个文件从S3读入到RStudio中。我尝试通过sparklyr完成此操作，如下所示： spark_install(version = "2.1.0") sc <- spark_connect(master = "local") ctx <- sparklyr::spark_context(sc) #Use below to set the java spark context jsc <- invoke_static( sc

浏览 10提问于2017-08-29得票数 2

2回答

读取csv函数时出错

r、sparklyr

在google计算集群中，我正在尝试使用sparklyr包将csv文件读取到strudio中。配置如下：测试Spark框架 install.packages("sparklyr") install.packages("dplyr") library(sparklyr) spark_install(version = "1.6.2") Sys.setenv(SPARK_HOME="/usr/lib/spark") config <- spark_config() sc <- spark_connect

浏览 1提问于2017-04-05得票数 0

2回答

Hadoop返回权限被拒绝

hadoop

我正在尝试在集群中安装hadoop (2.7) (两台机器hmaster和hslave1)。我在/opt/ /文件夹中安装了hadoop，但是当我运行命令start-dfs.sh时，我得到了以下错误： hmaster: starting namenode, logging to /opt/hadoop/logs/hadoop-hadoop-namenode-hmaster.out hmaster: starting datanode, logging to /opt/hadoop/logs/hadoop-hadoop-datanode-hmaster.out hslave1: mkdir:

浏览 2提问于2017-01-20得票数 0

3回答

无法解析主网址：'spark.bluemix.net‘

apache-spark、ibm-cloud、rstudio、sparklyr、data-science-experience

我试图从运行在我的桌面计算机上的RStudio连接到，该服务运行在Bluemix上。我从运行在IBM体验上的自动配置的config.yml环境中复制了RStudio： default: method: "shell" CS-DSX: method: "bluemix" spark.master: "spark.bluemix.net" spark.instance.id: "myinstanceid" tenant.id: "mytenantid" tenant.

浏览 12提问于2017-03-07得票数 0

回答已采纳

1回答

Sparklyr copy_to失败

r、hadoop、apache-spark、sparklyr

我使用Sparklyr库从R到HDFS读取和写入数据。读取数据的工作原理是预期的，但是写入会带来问题。为了能够使用spark_write_csv函数，我需要将我的R data.frames转换成Spark对象。为此，我使用了sparklyr sdf_copy_to函数(也尝试过使用copy_to)。然而，我总是会犯错误代码： table1 <- sdf_copy_to(sc,dataframe,OVERWRITE=TRUE) spark_write_csv(table1, "path") 错误：错误: org.apache.hadoop.mapred.Invali

浏览 2提问于2017-03-01得票数 3

1回答

执行配置单元查询时出现权限被拒绝错误

hadoop、hive

当连接到beeline时，当执行select count(*) from tablename查询时，我得到以下错误。 ERROR : Job Submission failed with exception 'org.apache.hadoop.security.AccessControlException(Permission denied at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.checkOwner(FSPermissionChecker.java:201) 我可以成功地执行show

浏览 4提问于2015-06-26得票数 1

2回答

在挂载后尝试列出目录时，shaded.databricks.org.apache.hadoop.fs.azure.AzureException:异常

azure、exception、pyspark、azure-databricks、mount-point

我不例外， shaded.databricks.org.apache.hadoop.fs.azure.AzureException: java.util.NoSuchElementException:枚举结果时发生错误，请检查原始异常以获得详细信息首先，我在dbfs中挂载目录，如下所示， dbutils.fs.mount( source = f"wasbs://{containerName}@{storageAccount}.blob.core.windows.net/", mount_point = "/mnt/a", extra_configs

浏览 20提问于2022-03-01得票数 1

回答已采纳

1回答

无法从RStudio连接到sparklyr

r、apache-spark、rstudio、sparklyr、rstudio-server

我正在尝试从RStudio连接到spark。目前我们使用的是Cloudera Hadoop发行版，其中运行的是Spark (2.2)。我测试了从边缘节点开始的所有东西，我能够创建Spark上下文并执行我的查询。从RStudio到昨天一切都很好，突然我们遇到了RStudio的问题。 library(dplyr) library(sparklyr) config <- spark_config() config$spark.driver.memory <- "8G" config$spark.executor.memory <- &#

浏览 2提问于2018-11-13得票数 2

4回答

如何在hadoop中解压缩文件？

hadoop

浏览 7提问于2015-03-17得票数 14

1回答

Hadoop Map-Reduce输出文件异常

java、hadoop、exception、mapreduce

我在亚马逊d2.2Xlarge上运行单节点hadoop集群时出现此错误。我也无法查看我的output.Can。谁能提供正确的步骤来解决此问题？ "Caused by: org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directory for output/file.out" 这是我执行的步骤。 bin/hdfs dfsadmin -safemode leave bin/hadoop fs -mkd

浏览 2提问于2016-03-03得票数 2

3回答

无法从avro文件创建配置单元表

hive、create-table、avro

我可以使用以下语法在avro文件上创建一个表，而不会出现任何错误。乍一看，这是一张空桌子。 CREATE EXTERNAL TABLE tableName PARTITIONED BY (ingestiondatetime BIGINT, recordtype STRING) ROW FORMAT SERDE 'org.apache.hadoop.hive.serd2.avro.AvroSerDe' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat

浏览 4提问于2014-10-09得票数 2

4回答

在纱线管理的hadoop集群上部署spark时，sparklyr可以使用吗？

r、apache-spark、hadoop-yarn、sparkapi、sparklyr

能够连接到纱线管理的hadoop集群吗？这似乎没有在文档中被记录下来。使用Spark附带的SparkR包，可以执行以下操作： # set R environment variables Sys.setenv(YARN_CONF_DIR=...) Sys.setenv(SPARK_CONF_DIR=...) Sys.setenv(LD_LIBRARY_PATH=...) Sys.setenv(SPARKR_SUBMIT_ARGS=...) spark_lib_dir <- ... # install specific library(SparkR, lib.loc = c(sparkr_

浏览 7提问于2016-06-29得票数 5

回答已采纳

2回答

无法在浏览器上运行Hadoop的namenode

hadoop

这是我第一次在我的Linux上安装Hadoop (Fedora发行版)，运行在VM上(在我的Mac上使用并行)。我遵循这个上的每一步，包括 of it.And，然后当我在端口50070中的本地主机(或主机名的等效值)上运行它时，我得到以下消息。 ...can't establish a connection to the server at localhost:50070 当我通过顺带命令运行jps时，我没有datanode和namenode，不像文本版本教程的末尾，它有以下内容：虽然我的进程只有以下进程在运行： 6021 NodeManager 3947 Secondar

浏览 4提问于2016-10-11得票数 0

回答已采纳

1回答

没有显示在星火会话中的蜂巢表

r、apache-spark、hive、sparklyr

如果在R中运行DBI::dbGetQuery(sc, "SHOW DATABASES")，则只得到default数据库。而不是从hive>命令行创建的完整的单元表列表..。所以我猜sparklyr的星火会话不使用全局配置. 我用Spark3.3.0，Sparklyr 1.7.8和MySQL . 我尝试过将sql.warehouse.dir更改为hive's hive.metastore.warehouse.dir的值，即"/user/hive/warehouse"，sql.catalogImplementation改为"hive"

浏览 3提问于2022-10-18得票数 0

1回答

使用Scala install在R中运行SparklyR代码

r、scala、apache-spark、rstudio、sparklyr

希望使用sparklyr Spark install中包含的自定义scalac (Scala编译器)；可以在RStudio SparkUI选项卡(或从spark_web(sc))中找到>>环境>> /jars/scala-compiler-2.11.8.jar作为“系统环境”--而不是像中建议的那样，在基本目录中单独下载和安装scalac，并且链接到创建扩展的页面。这是我目前使用的Ubuntu，但在下面的错误中停滞不前。我设置了一个与上面"hello world“示例中使用的Github-repo完全相同的目录。知道如何在不安装到建议的基本路径文件夹--即/o

浏览 2提问于2016-12-12得票数 2

2回答

namenode形成中的Hadoop误差

ubuntu、hadoop、ubuntu-12.04

我是hadoop的新手，我在ubuntu尝试过基本的hadoop安装。在设置所有内容之后，我在格式化HDFS系统时得到了一个错误，当我运行它时，它显示了以下错误. 错误 hduser@ubuntu:/usr/local/hadoop/bin$ hadoop namenode -format -su: /usr/local/hadoop/bin/hadoop: Permission denied hduser@ubuntu:/usr/local/hadoop/bin$ ls -ltr total 116 -rw------- 1 hduser hadoop 1168 Jul 23 03

浏览 1提问于2013-08-07得票数 0

回答已采纳

2回答

使用Hadoop -copyFromLocal命令时，没有此类文件或目录错误

hadoop、hdfs、hortonworks-data-platform

我有一个本地VM，它安装了Hortonworks、Hadoop和hdfs。我从我的机器将ssh'ed复制到VM中，现在我试图通过以下命令将文件从本地文件系统复制到hdfs中： [root@sandbox ~]# sudo -u hdfs hadoop fs -mkdir /folder1/ [root@sandbox ~]# sudo -u hdfs hadoop fs -copyFromLocal /root/folder1/file1.txt /hdfs_folder1/ 当我执行它时，我会得到以下错误为- copyFromLocal:/root/folder1/file1.txt

浏览 2提问于2016-01-16得票数 4

1回答

Sparklyr连接错误:spark_connect_gateway中出现错误(本地主机中的gatewayAddress、gatewayPort、sessionId、：Gateway :8880没有响应

r、sparklyr

我在连接到sparkyr时遇到了以下问题。 sc <- spark_connect(master = "local") * Using Spark: 2.4.3 Error in spark_connect_gateway(gatewayAddress, gatewayPort, sessionId, : Gateway in localhost:8880 did not respond. Try running `options(sparklyr.log.console = TRUE)` followed by `sc <- spark_connec

浏览 92提问于2021-04-15得票数 1

1回答

失败:执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码1。文件或目录不存在

hive

在运行简单SELECT COUNT(*) FROM Table时在Hive中获得以下异常。作业提交失败，异常'org.apache.hadoop.io.nativeio.NativeIOException(No --这类文件或目录)‘失败:执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码1。没有这样的文件或目录在简单的SELECT * FROM Table上没有出现问题。请建议问题出在哪里。蜂巢执行引擎是MR. . 错误的完整堆栈跟踪： 2017-07-18T07:18:52,744错误主语：'org.

浏览 3提问于2017-07-18得票数 1

1回答

Sparklyr -无法实例化SessionHiveMetaStoreClient

r、hadoop、apache-spark、hive、sparklyr

当试图使用sparklyr (0.5.3)库(云中的同一台机器)从getting连接到Spark集群(Spark2.0.1)时，我将得到一个错误，如下所示。看起来需要一个md_metastore，它无法实例化。我没有hivesite.xml配置文件(不确定这是否是一个问题)。 spark.sql.warehouse.dir = file:///usr/lib/spark/spark-2.0.1-bin-hadoop2.6/warehouse 有什么不对的吗？谢谢你，米哈尔 library(sparklyr) # Set up environment variables Sys.seten

浏览 0提问于2017-04-18得票数 2

回答已采纳

1回答

Spark for Sparklyr的兼容版本

sparklyr

Spark的哪些版本与Sparklyr兼容，有权威来源吗？或者，有谁能阐明如何确定这一点？我使用的是macOS，但使用Spark2.4.x并不成功；它们都无法连接，通常会产生一个"Failed to connect to sparklyr to port 8880...“错误。我终于用Spark 2.3.0解决了问题。但是，如果我尝试安装2.3.3，我得到一个错误： > spark_install("2.3.3") Error in spark_install_find(version, hadoop_version, installed_only = FA

浏览 15提问于2019-05-17得票数 0

回答已采纳

7回答

如何与其他用户一起使用单元格

hive

我在3集群上安装了Hadoop和Hive。通常我可以使用Hive和Hadoop，但是当我与其他用户登录时，我不能使用hive。错误是： hive>显示表；失败:元数据中的错误: javax.jdo.JDOFatalDataStoreException:无法获得连接，池错误无法创建经过验证的对象，原因是:只读用户或只读数据库中的用户不允许在连接上禁用只读模式。 NestedThrowables： org.apache.commons.dbcp.SQLNestedException:无法获得连接，池错误无法创建经过验证的对象，原因是:只读用户或只读数据库中的用户不允许在连接上禁用只读模式

浏览 10提问于2012-03-15得票数 12