腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将jar添加到正在运行
的
spark上下文中?
、
为了详细说明,我使用
livy
创建
一个
spark
会话
,然后将作业提交给
在
同一spark
会话
中运行它们
的
livy
客户端。现在,如果我需要在其中
一个
作业中添加
一个
新
的
jar
作为
依赖项,有没有办法将该jar放入正在运行
的
spark
会话
中? 我尝试过spark.jars,但它只
在
创建
会话</em
浏览 0
提问于2018-05-15
得票数 1
1
回答
在
Livy
上
创建
一个
新
会话
作为
另一个
会话
的
副本
、
、
、
我使用
livy
来使用Spark
作为
服务。我
的
应用程序将一些命令
作为
代码发送给
livy
,然而,spark需要初始化一些变量(读取一些文件,进行一些map&reduce操作等)。这需要时间。此初始化部分对于所有
会话
都是通用
的
。
在
构造之后,可以将不同
的
语句发送到这些
会话
。 我想知道
的
是,当
livy
创建
会话
时,是否可以复制旧
的
<
浏览 14
提问于2016-09-21
得票数 1
回答已采纳
3
回答
在
python中使用
livy
时响应对象
的
状态为“dead”
、
、
、
我正在尝试使用
livy
,这也是我第一次使用REST api。跟随,当我键入然后我接收
作为
输出
的
根据本教程,
会话
状态应该是iddle,但在启动完成后,它似乎会更改为dead。我不知道该怎么做才能将状态保持
在
iddle中,这样我才能发出post请求。在运行服务器
的
控制台中,我收到以下输出16/08/02
浏览 11
提问于2016-08-02
得票数 0
回答已采纳
3
回答
Livy
会话
错误
在
Jypyter中与火花魔术-错误repl.PythonInterpreter:进程已死亡1
、
、
、
我正在运行
一个
Sparkv2.0.0纱线集群。我让
livy
在
火星之主旁边跑。
在
jupyter
的
“管理火花”部分中
创建
新
会话
时,从
Livy
日志中获得
的
错误 17/02/10 13:06:08 INFO Stat
浏览 10
提问于2017-02-10
得票数 2
回答已采纳
1
回答
K8S
上
的
Livy
,名称空间限制
、
、
、
我
在
特定命名空间中
的
K8S
上
运行了spark (3.0.1)、
livy
(0.8.0)和Jupyterhub (火花魔术),Kubernetes master
作为
资源管理器使用。当我试图
在
木星中心
的
笔记本中
创建
pyspark
会话
时,我得到了
一个
错误: 22/02/04 12:09:16警告InteractiveSession:未能阻止RSCDriver。杀了它。配置
的
服务帐户没
浏览 21
提问于2022-02-07
得票数 0
1
回答
如何在Nifi ExecuteSparkINteractive处理器中管理‘等待’状态?
、
、
我正在使用Nifi ExecuteSparkInteractive处理器运行spark代码,我看到它
的
结果是成功、失败和等待。当结果进入成功和失败状态时,我能够很好地管理和路由结果,但有时我看到文件丢失,我认为它将处于等待状态,并且
在
我
的
Nifi流中没有为“等待”状态定义路由。谁能帮助我理解什么是“等待”状态,以及如何在不影响最终结果
的
情况下路由此状态下
的
控件。 提前谢谢你!我尝试将nifi控件路由到UpdateAttribute处理器,但我看不到任何来自spark代码
的
结果。看起来<e
浏览 1
提问于2019-06-23
得票数 2
2
回答
木星替代齐柏林飞艇:多语种星火
、
、
、
主要是拥有多语种星火支持--
在
木星中是否有可能
创建
一个
可以通过R、Scala、Python和SQL访问
的
星火数据框架,所有这些都在同
一个
笔记本中?我们已经编写了Scala库来
创建
数据框架并将其返回给用户,用户可能希望使用各种语言来操作/查询数据框架。
在
木星环境中,是解决这个问题
的
解决方案吗?我无法从
Livy
的
网站上判断给定
的
连接是否只支持一种语言,或者每个
会话
是否可以有
浏览 2
提问于2018-08-14
得票数 3
1
回答
将jar上载到Apache交互式
会话
、
、
、
使用亚马逊emr-5.30.1配
Livy
0.7和Spark2.4.5curl -X POST \ -d '{"conf": {"kind" : "spark","jars": "s3://cjspro-emr-da
浏览 2
提问于2020-07-16
得票数 1
1
回答
运行spark notebook原型代码
的
动态方法
、
一旦我使用Spark notebook
创建
了Scala代码
的
原型,我就会将相关
的
单元复制到
一个
脚本文件中,这个脚本文件是我从Apache Spark CLI调用
的
。有没有一种更惯用
的
方式来帮助代码重用? 那么,与其从spark notebook
创建
脚本文件,还不如通过api调用运行notebook本身?
浏览 0
提问于2017-05-03
得票数 1
1
回答
关于AWS EMR星火上木星中心
的
Livy
会议
、
我
的
客户
在
AWS EMR
上
安装了
一个
安装在木星集线器
上
的
AD连接器,以便通过AD
在
Jupyterhub
上
验证不同
的
用户。目前
的
理解是,当不同
的
用户通过木星中心上
的
木星笔记本向共享
的
EMR火花引擎提交他们
的
火花作业时,火花作业将通过
Livy
提交给火花引擎。每个
Livy
会议都将有
一个
相关
的
浏览 0
提问于2018-12-24
得票数 2
回答已采纳
1
回答
Apache
Livy
- Rest API
、
在网上浏览之后,我认为
Livy
可以用来做这件事。
Livy
已经安装了HDP 2.5。因此,我使用POST/Sessions
创建
了
新
的
Livy
会话
,并包含了我
的
jar文件。注意:- jar必须放在HDFS中才能正常工作 根据
Livy
的
示例:- https://
livy
.apache.org/examples/我可以将代码片段
作为
&qu
浏览 32
提问于2020-03-30
得票数 0
3
回答
如何在电子病历集群引导
上
设置
livy
.server.session.timeout?
、
、
我正在
创建
一个
EMR集群,并使用jupyter notebook运行一些spark任务。我
的
任务
在
执行大约1小时后就会死掉,错误是:Invalid status code '400' from https://xxx.xx.x.xxx:我
的
理解是它与
Livy
config
livy
.server.session.timeout相关,但是我不知道如何在集群
的
引导
浏览 2
提问于2019-01-16
得票数 13
回答已采纳
1
回答
如何确定Apache
的
“允许
的
最大活动
会话
计数”?
、
、
、
比方说,我想继续为提交给纱线
的
每个火花作业
创建
一个
会话
。每个连接都有
一个
唯一
的
用户,该用户一直
在
轮询状态和将语句发送到
会话
。我如何计算,在任何给定
的
时间里,
Livy
可以有多少个活动
会话
?是基于我配置
的
livy
.spark.driver大小吗?这个计算所涉及
的
其他参数是什么?
浏览 1
提问于2019-09-11
得票数 1
3
回答
通过http运行
livy
作业,而无需每次都上传jar
、
、
我正在使用
Livy
/Spark,我对如何使用其中
的
一些感到有点困惑。
在
livy
examples文件夹中有
一个
上传到spark
的
构建作业
的
示例。我喜欢正在使用
的
接口,但我想通过http连接到
livy
/spark,因为我没有java客户端。这样看来,如果我使用livyclient上传jars,它只存在于那个spark
会话
中。老实说,我正在试图弄清楚最好
的
方法是什么。我希望能够通过s
浏览 2
提问于2018-05-12
得票数 1
1
回答
是否可以使用固定
的
Spark上下文池并行运行多个spark作业?
我是Spark
的
新手,所以任何建议,无论是关于相关工具或针对我
的
用例建议
的
设计更改,都将不胜感激。我目前
的
情况是,我有几百万个独立
的
Spark作业,运行时间不是很长(平均几秒钟),我使用
Livy
以批处理模式提交它们。问题是,初始化每个作业
的
Spark上下文所需
的
时间比运行作业本身所需
的
时间要长得多。因此,我
的
想法是初始化spark上下文
的
修复池,并使用它们来运行所有这些作业,而不是每次运行作业时都获
浏览 2
提问于2021-09-06
得票数 1
1
回答
成功
创建
spark上下文后,
Livy
会话
继续启动
、
、
、
我一直
在
尝试用运行在Ubuntu 18.04
上
的
Livy
0.7服务器
创建
一个
新
的
spark
会话
。
在
同一台机器
上
,我有
一个
具有2个工作进程
的
正在运行
的
spark集群,并且我能够
创建
一个
普通
的
spark-session。我
的
问题是,
在
向
Livy</em
浏览 40
提问于2020-06-03
得票数 5
1
回答
批模式错误中
的
livy
抛出错误:只支持本地python文件:解析参数
、
、
、
我尝试
在
批处理模式下执行
livy
,方法是提交
一个
python文件,但是它不起作用,我尝试了两种方法- hduser@tarun-ubuntu:/home/tarun/spark/examples/src/main/python$ curl
浏览 1
提问于2016-10-28
得票数 1
1
回答
Spark内核笔记本之间
的
集群共享
、
、
、
、
我希望从概念
上
理解
在
Spark内核(如SparkMagic)
上
运行
的
几个Jupyter笔记本如何共享
一个
工作节点集群。如果用户A
在
计算单元中持续或缓存了
一个
大
的
RDD (无论是
在
磁盘上还是在内存中),然后出去度周末,但没有停止他/她
的
笔记本,这是否会降低其他用户在用户A
的
笔记本运行时运行其作业
的
能力?也就是说,共享集群
的
所有Spark notebooks
浏览 20
提问于2021-01-25
得票数 1
1
回答
更改EMR集群中
Livy
使用
的
Python版本
、
、
Livy
继续使用Python2.7,不管使用什么。注意:这在运行
Livy
0.7.0
的
另一个
EMR集群中没有任何问题,我已经遍历了<em
浏览 6
提问于2021-05-03
得票数 2
2
回答
如何使用AirFlow提取使用Apache批处理POST方法提交
的
火花作业客户端日志
、
、
这个HTTP请求是使用AirFlow发送
的
。提交作业后,我使用批处理Id跟踪状态。我想在气流日志
上
显示驱动程序(客户端日志)日志,以避免AirFLow和Apache /Resource访问多个地方。 使用Apache可以这样做吗?
浏览 4
提问于2019-01-20
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券