腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
运行
Spark
的
EMR
笔记本
-
如何
从
私有
github
分支
安装
其他
库
apache-spark
、
jupyter-notebook
、
amazon-emr
我想在
EMR
Notebook virtualenv中
安装
一个python
库
,就像在sc.install_pypi_package("arrow==0.14.0", "https://pypi.orgpython
库
并不是以pypi包
的
形式发布
的
,而是位于
私有
github
存储
库
的
自定义
分支
上。我
如何
才能参考git repo并为AWS
浏览 3
提问于2020-01-01
得票数 2
4
回答
EMR
笔记本
安装
附加
库
bash
、
amazon-web-services
、
jupyter-notebook
、
libraries
、
amazon-emr
我有一个令人惊讶
的
困难
的
时间与更多
的
图书馆通过我
的
电子病历
笔记本
。
EMR
的
AWS接口允许我创建木星
笔记本
并将它们附加到正在
运行
的
集群中。我想在里面使用更多
的
库
。SSHing进入机器并以ec2-user或root
的
形式手动
安装
不会使
笔记本
可以使用
库
,因为它显然使用livy用户。引导操作为hadoop
安装<
浏览 0
提问于2019-02-14
得票数 16
2
回答
Sagemaker Studio Pyspark示例失败
amazon-web-services
、
pyspark
、
jupyter-notebook
、
amazon-sagemaker
当我尝试在Sagemaker Studio中使用PySpark
运行
Sagemaker时,提供了一些示例 import os # See the SageMaker
Spark
Github
repo under sagemaker-pyspark-sdk# to learn how to connect to a remote
EMR
cl
浏览 20
提问于2021-01-18
得票数 2
回答已采纳
1
回答
用纱线客户端代替livy
的
Sagemaker
笔记本
到
EMR
火花源
python
、
pyspark
、
amazon-emr
、
amazon-sagemaker
我知道,关于
如何
通过SparkMagic预装
的
内核将Sagemaker
笔记本
连接到
EMR
集群上,有很好
的
教程,但是我们希望使用纱线-客户端模式(而不是livy )连接到集群,以便能够使用我们已经拥有的Sagemaker实例中
的
库
和信任,这个想法是在巨大
的
数据集上
运行
python代码,获得摘要,并使用我们在sag产
笔记本
中已经拥有的大量python
库
和自定义内部
库
来完成摘要
的
浏览 8
提问于2022-06-13
得票数 0
1
回答
如何
在电子病历上
从
S3桶中读取XML文件?
xml
、
amazon-web-services
、
pyspark
、
amazon-emr
我已将XML文件存储在S3桶中,并希望在输入以下内容后在
EMR
上读取它们: sqlContext.read.format("com.databricks.
spark
.xml").option("rowTag::java.lang.ClassNotFoundException:未能找到数据源: com.databricks.
spark
.xml。请在找到包裹
浏览 0
提问于2019-08-11
得票数 0
2
回答
如何
从
本地
运行
的
Spark
Shell连接到
Spark
EMR
apache-spark
我已经创建了一个
Spark
EMR
集群。我希望在本地主机或
EMR
集群上执行作业。假设我在本地计算机上
运行
spark
-shell,我
如何
告诉它连接到
Spark
EMR
集群,要
运行
的确切配置选项和/或命令是什么?
浏览 2
提问于2016-06-06
得票数 5
3
回答
AWS
EMR
火花1.0
amazon-web-services
、
apache-spark
、
emr
有没有办法强迫亚马逊
EMR
使用
Spark
1.0.1?当前可选择
的
版本停留在1.4.1。我在MLlib中使用交替
的
最小二乘实现,自v1.1以来,它们已经实现了加权正则化,并且出于特定
的
原因(研究研究),我不希望这个实现,而是我试图访问他们在v1.0中实现
的
非加权正则化版本。我正在与Scala一起使用Zepplin
笔记本
,如果这有帮助的话。
浏览 5
提问于2016-03-28
得票数 0
回答已采纳
1
回答
如何
在电子病历
笔记本
中
安装
.jar依赖项?
pyspark
、
jupyter-notebook
、
dependencies
、
amazon-emr
我正在
运行
一个
EMR
笔记本
(平台: AWS,
笔记本
: jupyter,内核: PySpark)。我需要
安装
一个.jar依赖项(sparkdl)来处理一些映像。使用火花-提交,我可以使用:使用本地
笔记本
,我可以使用-
spark
2.4-s_2.11')
浏览 3
提问于2019-12-17
得票数 4
1
回答
从
ECS码头集装箱
运行
EMR
作业
amazon-emr
、
amazon-ecs
我已经将用python编写
的
ML作业代码包含到一个码头容器中,并能够使用Amazon作为码头服务
运行
。我想使用星星之火以分布式方式
运行
,并在亚马逊
EMR
.Can上部署,建立ECS和
EMR
之间
的
连接?
浏览 3
提问于2017-05-25
得票数 9
回答已采纳
4
回答
安装
SparkR
r
、
apache-spark
、
sparkr
我有最后一个版本
的
R-3.2.1。现在,在执行以下操作之后,我想在R上
安装
SparkR:我回来了:Warning in install.packages :我还在我
的
机器上
安装
了火
浏览 6
提问于2015-07-02
得票数 52
回答已采纳
1
回答
在电子病历
从
设备上
运行
命令?
apache-spark
、
hadoop-yarn
、
emr
、
amazon-emr
我正在尝试使用pip install在所有
从
机器上更新正在
运行
的
EMR
集群。我该怎么做呢? 我不能使用bootstrap步骤来完成它,因为它是一个长时间
运行
的
EMR
,我不能将其删除。
EMR
集群正在
运行
Spark
& Yarn,所以我通常会使用
spark
slaves.sh,但我在主节点上找不到该脚本。是不是
安装
在我找不到
的
地方?或者有什么方法可以
安
浏览 0
提问于2016-12-01
得票数 9
2
回答
设置Jupyter Pyspark在EC2和
EMR
之间工作
amazon-web-services
、
apache-spark
、
amazon-ec2
、
pyspark
、
jupyter-notebook
我在
EMR
里
运行
了一个
spark
集群。我还有一台
运行
在第二台EC2机器上
的
jupyter
笔记本
电脑。我想通过jupyter在我
的
EC2实例上使用
spark
。我正在寻找有关
如何
配置
spark
以
从
EC2访问
EMR
集群
的
参考资料。搜索给我
的
只是关于
如何
在
EMR
或EC2上设置
spark
的</e
浏览 18
提问于2017-06-28
得票数 0
1
回答
如何
确保依赖于
分支
的
推送目的地?
git
、
github
我将在
GitHub
上开源我
的
应用程序之一,并希望有以下工作流: 将发现合并到prod
分支
→,将该
分支
推到向公众开放
的
GitHib公共存储
库</em
浏览 0
提问于2021-09-09
得票数 1
1
回答
EMR
6.1.0上
的
默认Python3内核不在我
的
集群上吗?
amazon-web-services
、
jupyter-notebook
、
amazon-emr
我注意到在将
EMR
笔记本
附加到带有Hadoop、
Spark
和Livy
的
EMR
6.1.0集群上时,出现了一些奇怪
的
情况。您知道,我在主节点上
安装
的
包在缺省
的
Python3内核中不可用,但在缺省
的
PySpark内核中可用。 当我在PySpark内核上获得主机名时,我可以看到它与我
的
主节点
的
私有
DNS名相匹配。然而,当我
运行
Python3或终端内核时
浏览 12
提问于2020-09-18
得票数 0
3
回答
使用
github
特定
分支
的
pip
安装
包
git
、
pip
、
branch
我遇到了一个非常奇怪
的
问题。我尝试
从
github
分支
通过pip
安装
一个包。我在过去已经做过很多次了,它总是有效
的
。pip install git+https...@my_branch 虽然这在我
的
本地机器上工作得很好,但当我尝试使用Windows远程机器和我
的
Ubuntu Vagrant box时,它却不起作用。它不使用my_branch
安装
包,而是
安装
主
分支
。
浏览 0
提问于2017-01-06
得票数 21
回答已采纳
2
回答
您应该
如何
在
Spark
EMR
集群上
运行
jupyter
笔记本
amazon-web-services
、
apache-spark
、
amazon-s3
、
amazon-emr
、
spark-submit
编辑:这个问题是关于您应该
如何
定义python/jupyetr-notebook文件
的
参数,以便在
EMR
Amazon
Spark
Cluster上进行
spark
-submit ...我已经在Amazon AWS (
EMR
)上创建了
Spark
Yarn集群,有一个主服务器和3个
从
服务器。我在上面创建了一个jupyter
笔记本
(并且能够使用PySpark内核
运行
和查看输出)。我已经使用PuttY连接到集群(我
浏览 1
提问于2020-07-10
得票数 1
2
回答
JupyterHub服务器无法在
私有
子网中
运行
的
Terraformed
EMR
群集中启动
amazon-s3
、
terraform
、
amazon-emr
、
terraform-provider-aws
、
jupyterhub
我正在使用Terraform创建一个
EMR
集群(
emr
-5.24.0),部署到一个
私有
子网,其中包括
Spark
、Hive和JupyterHub。我已经在部署中添加了额外
的
配置JSON,这应该会将Jupiter
笔记本
的
持久性添加到S3中(而不是本地磁盘上)。 整个架构包括一个连接到S3
的
VPC端点,并且我能够访问我试图将
笔记本
写入
的
存储桶。"s3.persistence.bucket": "
浏览 33
提问于2019-06-26
得票数 0
1
回答
开始-火种,IPython
笔记本
与火花放电
python
、
hadoop
、
apache-spark
、
ipython-notebook
、
pyspark
我想了解
如何
设置一切,以便能够有一个iPython
笔记本
和火花放电工作。如果我错了,请告诉我,但我想我可以用这个:()aws
emr
create-cluster --name "
Spark
cluster" --release-label
emr
-4.1.0 --applications Name=
Spark
--ec2-attributes
浏览 4
提问于2015-10-23
得票数 0
回答已采纳
1
回答
EMR
类路径冲突
amazon-web-services
、
apache-spark
、
amazon-emr
我正在
运行
一个带有fat阴影jar
的
EMR
步骤(星火提交),但是
从
EMR
获取
的
旧版本
库
会导致NoSuchMethod异常。
如何
确保app jar中
的</em
浏览 1
提问于2021-05-18
得票数 3
1
回答
Spark
内核
笔记本
之间
的
集群共享
amazon-web-services
、
apache-spark
、
jupyter-notebook
、
amazon-emr
、
amazon-sagemaker
我希望
从
概念上理解在
Spark
内核(如SparkMagic)上
运行
的
几个Jupyter
笔记本
如何
共享一个工作节点集群。如果用户A在计算单元中持续或缓存了一个大
的
RDD (无论是在磁盘上还是在内存中),然后出去度周末,但没有停止他/她
的
笔记本
,这是否会降低
其他
用户在用户A
的
笔记本
运行
时
运行
其作业
的
能力?也就是说,共享集群
浏览 20
提问于2021-01-25
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券