我想将本地桌面RStudio会话通过sparklyr连接到远程spark会话。当您在RStudio中的sparklyr选项卡中添加一个新连接并选择群集时,表示您必须在集群上运行,或者具有到集群的高带宽连接。
有人能说明如何建立这种联系吗?我不知道如何创造这方面的可复制的例子,但总的来说,我想做的是:
library(sparklyr)
sc <- spark_connect(master = "spark://ip-[MY_PRIVATE_IP]:7077", spark_home = "/home/ubuntu/spark-2.0.0", version="2.0.0")从远程服务器。我知道会有延迟,特别是当试图在遥控器之间传递数据时。我还知道,最好在实际的集群上有RStudio --服务器,但这并不总是可能的,我正在寻找一个用于服务器和桌面RStudio会话之间交互的sparklyr选项。谢谢。
发布于 2016-11-01 17:38:36
https://stackoverflow.com/questions/39798798
复制相似问题