腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
在
Sparklyr
中
从
ALS
实现
中
提取
潜在
因素
、
、
使用
sparklyr
文档
中
的
ALS
示例:sc <- spark_connect(master = "local") rating = c(3, 1, 2, 4, 5, 4)movies_tbl <- sdf_copy_to(sc, movies) model <- ml_
als
(movies_tbl, rating ~ user + it
浏览 10
提问于2019-11-20
得票数 1
回答已采纳
1
回答
将Spark ML
中
的肌萎缩侧索硬化症
潜在
因素
保存到S3耗时过长
、
、
、
我正在使用Python脚本来计算用户和项目的
潜在
因素
,使用Spark ML的
ALS
例程,如所述。
在
计算
潜在
因子之后,我尝试使用以下内容将这些因子保存到S3:model.itemFactors.rdd.saveAsTextFileLFA的计算速度很快(~15分钟),但将
潜在
因素
写到S3
中
几乎需要5个小时。因此,很明显,有些事情是
浏览 2
提问于2017-01-06
得票数 1
1
回答
中
ALS
机器学习算法
中
的秩是什么?
、
、
、
我想尝试一个
ALS
机器学习算法的例子。而且我的代码工作得很好,但是我不理解算法中使用的参数rank。我
在
java中有以下代码 int rank = 10; MatrixFactorizationModel model =
ALS
.train(JavaRDD.toRDD(ratings), rank, numItera
浏览 2
提问于2015-06-09
得票数 16
回答已采纳
1
回答
Sparklyr
Spark 2.1生成顶级推荐
、
、
、
、
R
版本3.3.0 (2016-05-03)
Sparklyr
版本“0.7.0”Spark 2.1
在
纱线客户端model_
als
<-ml_
als
_factorization(x, rating.column = "quantity",
浏览 0
提问于2018-04-10
得票数 0
1
回答
numIteraions和lambda
在
ALS
.train()
中
的秩是什么?
、
、
、
我正在尝试使用协同过滤使用
ALS
算法。
在
该算法
中
,我需要说明用于训练算法的秩、numIterations和lambda参数。我需要知道如何为最小和最大的数据集调整这个算法,以产生更好的预测。
浏览 3
提问于2017-08-23
得票数 1
回答已采纳
1
回答
Sparklyr
未连接到数据库
、
、
、
、
我正在尝试使用
sparklyr
或SparkR连接到数据库。install.packages("
sparklyr
") Failed to
浏览 0
提问于2018-11-27
得票数 1
1
回答
在
R
中
运行spark包不起作用,如何在
R
中
调用spark包?
、
、
我正在尝试通过
sparklyr
在
R
中
实现
fp-growth算法。警告消息说它不适用于我的
R
版本,但我相信这是最新的
R
版本。 除此之外,我还可以如何安装ml_fpgrowth包?
浏览 3
提问于2019-04-05
得票数 0
1
回答
如何将SparkR转换为
sparklyr
?
、
、
、
如何将SparkR
中
的SparkDataFrame转换为
sparklyr
中
的tbl_spark有什么建议可以解决这个问题吗? 谢谢!
浏览 6
提问于2020-11-06
得票数 2
1
回答
火花
ALS
算法给出了太多的零因子
、
、
、
我们
在
spark 2.2.1
中
使用
ALS
来计算用户嵌入和项嵌入。我们的实验样本包含120亿个实例,点击的实例被标记为正实例,反之则为阴性。在对嵌入进行检查后,我们发现,即使用户单击了一些异常项,
ALS
也可能给出零的
因素
。 .groupByKey().zipWithIndex() .persist(StorageLevel.MEMORY_AND_DIS
浏览 2
提问于2019-08-27
得票数 0
回答已采纳
1
回答
Sparklyr
中
split-apply-combine策略错误处理
、
、
我有一个名为"userid“的Spark DataFrame,我正在使用
sparklyr
对其进行操作。每个userid可以有从一行数据到几百行数据的任何地方。group_by(userid) %>% ungroup() 我想把这个函数包装在一个错误处理程序
中
,比如purrr::possibly,这样如果一个错误出现在一个组
中
,计算就不会中断。具体地说,replyr::gapply“通过grouping列
中
浏览 8
提问于2019-06-04
得票数 0
回答已采纳
2
回答
在
Hadoop中使用spark_apply
从
sparklyr
运行系统命令
、
、
、
、
我想对存储
在
Hadoop集群
中
的数据运行Java工具。我正在尝试使用
sparklyr
中
的spark_apply函数来
实现
,但我对语法感到有点困惑。/
r
_env.zip/
r
_env/lib/
R
"c
浏览 0
提问于2018-10-18
得票数 1
1
回答
如何使用木星笔记本
中
conda环境
中
的特定Java版本
、
、
、
、
我的总体目标是使用
sparklyr
在
一个
R
木星笔记本
在
我的天云服务木星实验室。我创建了一个新的conda环境,其中包含了
R
、
sparklyr
和Java 8(因为这个版本是
sparklyr
支持的版本),如下所示:sou
浏览 2
提问于2019-11-15
得票数 2
回答已采纳
1
回答
Sparklyr
-
在
spark-submit
中
更改日志级别
、
、
我试图
实现
的是
在
${SPARK_HOME}/bin/spark-submit执行期间将记录到控制台的所有信息静默。我已经通过更改${SPARK_HOME}/conf/log4j.properties
中
的适当行更改了spark本身的日志级别,但当我提交
R
-
sparklyr
脚本和
sparklyr
.jar以作为一种独立作业执行时,我仍然会获得以下信息: # 用户@主机${SPARK_HOME}/bin/spark-submit --c
浏览 27
提问于2021-07-02
得票数 0
1
回答
火花表的等效"str()“(描述dataframe)
、
、
我的问题归结为:
Sparklyr
相当于str
R
命令的什么?如何描述这张桌子?事先道歉,这是一个非常基本的问题,但我确实搜索了它,并检查了Rstudio的
Sparklyr
Cheatsheet,但没有找到答案。
浏览 0
提问于2019-08-02
得票数 0
回答已采纳
2
回答
创建具有可变函数的新列
、
、
如果这种问题不能用火花解决的话,我很惊讶:# in this format: YYYY-MM-DD (year, month, day) ... ...我收到这个错误: Error: org.apache.spark
浏览 4
提问于2016-10-27
得票数 3
回答已采纳
1
回答
用起泡启动数据库上的H2O上下文
、
、
、
、
问题 Spark 3.0.2不
浏览 0
提问于2021-04-21
得票数 0
回答已采纳
1
回答
与Kerberos的连接
、
、
、
但是,如果启用了Kerberos安全性,则连接将失败:sc <- spark_connect("http://host:8998", method = "livy"Try spark_connect with config = livy_config()我做错了什么?这种连接需要哪些额外的设置?注: RStudio服务器(we
浏览 1
提问于2017-06-23
得票数 5
1
回答
在
Oracle数据库连接中使用
sparklyr
、
、
、
、
我想得到一些关于合并以下
R
包的方法的解释:-
sparklyr
:用于计算独立星团上的数据-on我的客户端计算机,我使用dbConnect()函数
从
ODBC
R
包连接到一个现有的ODBC数据库。此Oracle数据库托管
在
windows服务器上。我使用位于同一个本地网络但与windows服务器隔离的一些计算机分别
实现
了一个Spark独立集群:通过使用这个Spark集群,我希望使用
sparklyr
包的
s
浏览 4
提问于2018-03-11
得票数 1
回答已采纳
1
回答
推荐系统的矩阵因式分解
、
、
、
首先,
在
同一家餐厅,每2名用户需要4次评论。但我的数据将非常稀少。不太可能有2个用户会对相同的4家餐厅进行审查。
在
我的测试
中
,我成功地计算出了一家用户尚未审查的餐馆的评级预测,但当我
在
稀疏数据集上使用该算法时,结果还不够好。(大多数情况下,两家餐厅之间不可能有相似之处,因为没有2家用户对同一家餐厅进行评级)。我找到了几十个计算这些数字的公式,但我想不出如何将它们分解并应用到我的应用程序
中
。在这个表
中
,U1代表用户,<e
浏览 2
提问于2016-11-03
得票数 13
回答已采纳
2
回答
如何在spark mllib中进行基于项目的推荐?
、
、
、
在
Mahout
中
,支持使用API方法进行基于项目的推荐:但是
在
Spark Mllib
中
,看起来
ALS
内部的API可以获取推荐的产品,但userid必须通过以下方式提供: MatrixFactorizationModel.recommendProducts
浏览 1
提问于2014-12-18
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券