sparklyr - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

无法将SparkR::sampleBy函数应用于sparklyr数据SparkR

apache-spark-sql、databricks、sparkr、sparklyr

我使用df_pqt_tbl <- spark_read_parquet(...)函数读取了一个拼花文件。我的环境是Databricks。我想使用SparkR::sampleBy函数进行分层抽样，但是我得到了一个错误： fractions = list('0'=0.7, '1'=0.7), seed =

浏览 0提问于2019-09-03得票数 1

回答已采纳

1回答

如何使用数据库让dplyr::summarize_all在sparkdataframe上工作？

r、apache-spark、dplyr、databricks

问题我有一个巨大的Spark Dataframe，叫做x。我正在使用databricks。X有数十亿条记录，太大了，不能收集到一台机器上。我要怎么做才能让它正常工作？： dplyr::summarize_all(x,mean) 更多信息这是我目前收到的错误消息： Error in UseMethod("tbl_vars") : no applicable method for 'tbl_vars' applied to an object of class "SparkDataFrame" 和 class(x) 返回:1 "S

浏览 17提问于2020-09-24得票数 2

回答已采纳

1回答

如何将SparkR转换为sparklyr？

r、apache-spark-sql、sparkr、sparklyr

如何将SparkR中的SparkDataFrame转换为sparklyr中的tbl_spark 这里提出了一个类似的问题：。

浏览 6提问于2020-11-06得票数 2

1回答

Sparklyr未连接到数据库

r、apache-spark、sparkr、databricks、sparklyr

我正在尝试使用sparklyr或SparkR连接到数据库。install.packages("sparklyr") Failed to

浏览 0提问于2018-11-27得票数 1

1回答

安装sparklyr版本0.8.4时出错

r、installation、sparklyr

我正在尝试从下面的链接安装sparklyr "0.8.4“的最新版本。install.packages("C:/Users/USER/Downloads/sparklyr-0.8.4.tar.gz", repos = NULL, type="source")In R CMD INSTALL [1] ‘0.8.4’> library(

浏览 0提问于2018-07-18得票数 0

回答已采纳

2回答

计算Spark R字符数的语法

r、apache-spark、sparkr、sparklyr

在R中，我们使用str_length()来实现同样的操作，在Spark R中，类似操作的语法是什么？ R语法 str_length(10)str_length(9) 1

浏览 11提问于2020-10-09得票数 0

回答已采纳

1回答

Sparklyr -在spark-submit中更改日志级别

r、apache-spark、sparklyr

我已经通过更改${SPARK_HOME}/conf/log4j.properties中的适当行更改了spark本身的日志级别，但当我提交R-sparklyr脚本和sparklyr.jar以作为一种独立作业执行时，我仍然会获得以下信息： # 用户@主机${SPARK_HOME}/bin/spark-submit --class sparklyr.Shell 'sparklyr.jar‘脚本。R 21/07/01 16:12:25信息sparklyr

浏览 27提问于2021-07-02得票数 0

1回答

无法通过sparklyr连接到Spark

r、apache-spark、sparklyr

我正在尝试使用R中的sparklyr包连接到spark，我得到了以下错误：> library(dplyr) > sc <-, --jars, "C:/Users&

浏览 13提问于2017-01-25得票数 0

2回答

如何从本地连接远程星团

apache-spark、rstudio、spark-dataframe、sparkr、rstudio-server

我在我的远程centos节点中有火花集群，我想从本地windows R studio (我在本地窗口中使用Rstudio桌面)连接那个远程火花集群。 Sys.setenv(SPARK_HOME = "/home/remoteclusterpath/spark-1.6.0-bin-hadoop2.6") .libPaths(c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib

浏览 4提问于2016-10-19得票数 0

1回答

使用sparklyr或sparkR连接红移？

r、amazon-redshift、databricks、sparkr、sparklyr

到目前为止，我可以从s3中读取CSV并将其写入spark dataframe，谁能展示一下如何配置far和其他东西，以便我可以将SparklyR(spark_read_jdbc() )或sparkR连接到

浏览 15提问于2019-02-21得票数 0

回答已采纳

1回答

Sparklyr:使用调用方法列出R中目录的内容

r、apache-spark、sparklyr

无法通过Spark找到内置用于列出目录内容的sparklyr，我正在尝试使用invokepath<- 'gs:// ***path to bucket on google cloud*** 'fs <-

浏览 2提问于2018-10-22得票数 3

回答已采纳

1回答

使用SparkR的Sparklyr* :解析函数参数的困难*

r、sparkr、sparklyr

我正在运行Sparklyr和SparkR。其他随附包裹:1 library(SparkR, lib.loc = c(file.path(Sys.getenv("SPARK_HOME"), "R", "lib")))"

浏览 1提问于2019-04-14得票数 0

2回答

在sparklyr中禁用配置单元支持

r、sparklyr

有没有办法在sparklyr中禁用hive支持？sparkR.session(master="local[*]", enableHiveSupport=FALSE)

浏览 9提问于2017-01-10得票数 5

回答已采纳

3回答

如何在R中的大型数据集(15 in )上运行监督ML模型？

r、large-data、feature-selection、sparklyr、supervised-learning

我尝试了以下方法：- data.table -仍然不足以减少处理时间- sparklyr -无法复制我的数据集，因为它太大我正在寻找一个无成本的解决方案来解决我的问题。有人能帮帮我吗？

浏览 25提问于2019-11-10得票数 0

1回答

无法从RStudio连接到sparklyr

r、apache-spark、rstudio、sparklyr、rstudio-server

library(dplyr) config <- spark_config() Log: /tmp/RtmpoNJQEH/f

浏览 2提问于2018-11-13得票数 2

1回答

无法使用spark会话、sparklyr和R加载Cassandra表

r、rstudio、spark-cassandra-connector、sparklyr

我用的是最新的sparklyr。我已经将默认配置设置为下面的?default： sparklyr.cores.local: !> library(sparklyr) Warning message: In readLines(input, encoding", "<Cassandra IP>") %>% sparklyr

浏览 1提问于2017-02-26得票数 1

1回答

带有apache箭头的Sparklyr* R失败，意外终止:对象'as_tibble‘未找到*

r、sparklyr、apache-arrow

我试图在中使用sparklyr来提高性能，例如，但是遇到了错误。下面是一个(希望)可重复的例子：library(sparklyr)config <- sparklyr::spark_config::mtcars, overwrite = TRUE)if ("arrow" %in% .packages()) detach("package:arrow&qu

浏览 0提问于2019-08-07得票数 1

回答已采纳

1回答

带分类预测的sparklyr* + lm*

r、sparklyr

我正在尝试使用分类预测器在sparklyr上运行lm。在普通R中工作的示例在sparklyr中失败：lm(Petal.Length ~ as.factor(Species), data = iris) ... 21/06/09 22:48:01 ERROR sparklyr: RScript (3130) terminated unexpectedly: contrasts can be: Worker (3130) failed to complete

浏览 7提问于2021-06-10得票数 2

1回答

将SparkR DataFrame序列化为jobj

r、apache-spark、cassandra、sparkr、sparklyr

例如，使用sparklyr扩展，我可以这样做：sparklyr::invoke("format", "org.apache.spark.sql.cassandra") %>>% sparklyr::invoke("option", "keyspace&

浏览 7提问于2017-01-22得票数 0

回答已采纳

1回答

在SparkR和sparklyr之间导入拼图文件所用时间的差异

r、parquet、databricks、sparkr、sparklyr

我正在使用SparkR和sparklyr在databricks中导入拼图文件。 data1 = SparkR::read.df("dbfs:/.../data202007*", source = "parquet", header = TRUE, inferSchema = TRUE) data1 = sparklyr::spark_read_parquet/data202007*") 导入的时间差很大：SparkR为6秒，sparklyr为11分钟！有没有一种

浏览 25提问于2020-09-25得票数 2

回答已采纳

点击加载更多

无法将SparkR::sampleBy函数应用于sparklyr数据SparkR

如何使用数据库让dplyr::summarize_all在sparkdataframe上工作？

如何将SparkR转换为sparklyr？

Sparklyr未连接到数据库

安装sparklyr版本0.8.4时出错

计算Spark R字符数的语法

Sparklyr -在spark-submit中更改日志级别

无法通过sparklyr连接到Spark

如何从本地连接远程星团

使用sparklyr或sparkR连接红移？

Sparklyr:使用调用方法列出R中目录的内容

使用SparkR的Sparklyr* :解析函数参数的困难*

在sparklyr中禁用配置单元支持

如何在R中的大型数据集(15 in )上运行监督ML模型？

无法从RStudio连接到sparklyr

无法使用spark会话、sparklyr和R加载Cassandra表

带有apache箭头的Sparklyr* R失败，意外终止:对象'as_tibble‘未找到*

带分类预测的sparklyr* + lm*

将SparkR DataFrame序列化为jobj

在SparkR和sparklyr之间导入拼图文件所用时间的差异

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐