首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >不允许EMR主SSH

不允许EMR主SSH
EN

Stack Overflow用户
提问于 2018-09-07 03:02:30
回答 1查看 47关注 0票数 0

为了运行Scala spark作业和运行spark shell查询……我已经SSHing进入电子病历的主节点,现在负责管理云的团队不允许我通过SSH进入电子病历主节点。可以利用的替代模式有哪些?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-07 07:01:51

如果云团队乐于允许访问齐柏林飞艇,那么它就是你最好的选择。

%spark解释器相当于在笔记本段落中运行的spark-shell

默认情况下,它还会导入spark.sqlSparkContext等重要内容,因此您不需要导入任何内容,只需运行代码即可:

代码语言:javascript
运行
复制
%spark
val myDf = spark.sql(“select * from table”)
myDf.limit(10).show()

val myOtherDf = spark.read.csv(“s3://bucket/key/object.csv”)
myOtherDf.limit(10).show()

(spark-shell也可以做到这一点,但我用得还不够多,还不足以让我随手知道)

由于齐柏林飞艇实际上是在Spark Master节点上运行的,您甚至可以使用shell解释器%sh访问主节点的操作系统,例如:

代码语言:javascript
运行
复制
%sh
ls /
aws s3 cp s3://mybucket/myfile /

当然,您的访问权限取决于操作系统的权限。

请注意,一旦你杀死集群,你的笔记本也会消失!如果可能,请确保下载它。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52210621

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档