腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
3
流
作业
失败
,
无法
运行
程序
"
chmod
“
、
、
Kubernetes上的
Spark
3.0使用第三方细分IO REST API从Kafka读取数据并推送数据。我在
运行
Spark
stream
作业
时遇到以下错误 Caused by: java.io.IOException: Cannot run program "
chmod
": error=11, Resourceorg.apache.hadoop.fs.AbstractFileSystem.create(AbstractFileSystem.java:605) at org.apa
浏览 29
提问于2020-09-16
得票数 0
1
回答
如何在其中一个
作业
失败
时关闭/杀死火花
流
应用
程序
、
我正在
运行
一个星火
流
应用
程序
。有几次,其中一个
作业
由于某些
运行
时异常而
失败
。streaming将
作业
标记为
失败
,并继续处理下一个
流
批。如果其中一个
作业
失败
,是否有一个参数可以设置为通知
Spark
关闭应用
程序
(而不是处理下一个
流
批)?我在独立集群模式上使用
Spark
1.4.1。
浏览 0
提问于2016-06-10
得票数 0
1
回答
在oozie中使用单元上下文
失败
的火花
作业
、
、
、
、
在我们的一个管道中,我们使用
spark
(java)进行聚合,它是使用oozie编排的。此管道使用以下行将聚合数据写入ORC文件。modifiedFrame = hc.createDataFrame(aggregateddatainrdd, schema); 当oozie
作业
中的
浏览 0
提问于2017-03-09
得票数 0
回答已采纳
1
回答
在
运行
应用
程序
UI的Hadoop中没有出现星火setAppName
、
我正在
运行
星火
流
作业
,当我为我的星火
流
作业
设置应用
程序
名(一个更好的可读字符串)时,它不会出现在Hadoop
运行
的应用
程序
UI中。在Hadoop中,我总是将类名视为名称。val sparkConf = new SparkConf().setAppName("BetterName") 如何在
Spark
中设置
作业
名,使其出现在Hadoop中?
运行
应用
程序
的Hadoo
浏览 2
提问于2015-10-27
得票数 6
回答已采纳
1
回答
星星之火1.6Kafka
流
对dataproc py4j错误的影响
、
、
方法( org.apache.
spark
.streaming.api.java.JavaStreamingContext,类java.util.HashMap,类java.util.HashSet,类py4j.reflection.ReflectionEngine.getMethodLang.Thread.run(Thread.java:745)\n‘,) 我使用的是星火
流
-kafka-assembly_2.10-1.6.0.jar(它存在于我所有节点+主节点上的/usr/lib因此,
spark
应该使用正确的had
浏览 3
提问于2016-02-26
得票数 4
回答已采纳
7
回答
检查
Spark
流
作业
是否挂起的最佳方法
、
、
、
我有
Spark
streaming应用
程序
,它基本上从Kafka获得触发消息,这启动了批处理,这可能需要2个小时。有一些事件,其中一些
作业
无限期地挂起,并且没有在通常的时间内完成,目前我们
无法
在不手动检查
Spark
UI的情况下确定
作业
的状态。我想知道当前正在
运行
的
spark
作业
是否挂起的方法。我知道我可以使用驱动
程序
和执行器的度量标准。如果我要选择最重要的一个,它将是最后收到的批处理记录。当为StreamingMe
浏览 6
提问于2018-10-18
得票数 8
1
回答
结构化
流
集checkpointLocation偏移复制因子
、
、
我使用结构化
流
的
Spark
2.2和
运行
几个长期流式
作业
。每天或两天,我都会遇到以下错误: 当我遇到这个错误时,任务在重新启动时一直
失败
。我发现checkpointLocation下的偏移/提交文件是复制因子1,我想将复制因子
浏览 1
提问于2017-12-06
得票数 1
2
回答
压缩批次9时IllegalStateException:_
spark
_metadata/0不存在
、
、
、
我们有使用
Spark
Structured实现的
流
应用
程序
,它试图从Kafka主题读取数据并将其写入HDFS位置。有时应用
程序
会
失败
,并出现异常:java.lang.IllegalStateException: 10) 我们
无法
解决此问题。我找到的唯一解决方案是删除检查点位置文件,这将使
作业
在我们再次
运行</e
浏览 0
提问于2019-05-31
得票数 6
1
回答
在
Spark
程序
中访问Oozie配置
、
、
我正在尝试使用Scala中的sys.env()方法通过
Spark
程序
访问它。当我没有Oozie调度时,我能够正确地访问
Spark
中的环境变量。然而,当我尝试使用Oozie调度我的
程序
时,
程序
抛出一个错误,它
无法
读取环境变量。workflow.xml: <start t
浏览 1
提问于2020-01-14
得票数 0
1
回答
“列表”对象没有属性“foreach”
、
我试图复制以了解foreach是如何工作的,我尝试使用以下代码: print(a) 我理解返回类型的collect()是一个array(它是list)的错误,并且它没有与之关联的foreach属性,但是,我不明白如果在正式的
spark
我正在使用
Spark
3.0.1
浏览 0
提问于2020-09-17
得票数 1
回答已采纳
1
回答
Mesos上的火花-
运行
多个
流
作业
、
、
我有两个火花
流
作业
,我想
运行
,以及保留一些可用的资源,用于批处理
作业
和其他操作。1)这是否意味着单个核心可以在两个
流
应用
程序
之间移动?2)虽然我有
spark
& cassandra,但是为了利用数据局部
浏览 3
提问于2016-05-05
得票数 1
1
回答
Hortonworks Oozie火花行动
、
、
是否有人通过HDP中的Oozie成功地
运行
了火花操作?
spark
-exampl
浏览 3
提问于2016-03-15
得票数 0
2
回答
公平的调度模式能使从不同主题并行
运行
的星火
流
作业
吗?
、
、
在公平共享下,星火以“循环”的方式在任务之间分配任务,这样所有的
作业
都能获得大致相等的集群资源份额。这意味着在长
作业
运行
时提交的短
作业
可以立即开始接收资源,并且仍然可以获得良好的响应时间,而无需等待长
作业
完成。根据这一点,如果我有来自多个线程的多个
作业
,以防火花
流
(每个线程有一个主题),那么如果集群中有足够的核心,多个主题是否可能同时
运行
,或者它是否只是跨池执行一个循环,但一次只
运行
一个任务?现在,每个主题都有两个操作(因此有两个<e
浏览 2
提问于2017-06-06
得票数 2
1
回答
spark
存储选项卡下的“内存大小”显示火花
流
的RAM使用量随着时间的推移而增加。
、
、
我在我的应用
程序
中使用火花
流
。数据以每15分钟
流
文件的形式出现。我已经分配了10G内存来激发执行者。在这种情况下,我的星火应用
程序
运行
良好。但是通过查看
spark
,在存储选项卡 -> 中,内存的使用会随着时间的推移而不断增加。 当我开始
流
作业
时,“内存中的大小”使用的单位是KB。在将执行器内存增加到10G之前,火花
作业
几乎每5天就会出现故障(默认执行器内存为1GB)。随着执行器内存增加到10G,它从16天开始连续
运行<
浏览 0
提问于2016-02-18
得票数 4
1
回答
火花
流
作业
在ReceiverDisconnectedException类中
失败
、
、
我有
Spark
流
作业
,它捕获Azure Eventhub的几乎实时数据,
运行
24/7。更有趣的是,我的工作每天至少
失败
2次,出现以下错误。我并不担心数据丢失,因为火花检查点会在重新启动
作业
时自动处理数据,但我的问题是,为什么火花
流
作业
每天会以同样的错误
失败
2-
3
次。 有没有人面临同样的问题,有什么解决方案/解决办法。
浏览 1
提问于2019-11-14
得票数 0
1
回答
数据库中的Jar
作业
超时限制
、
在databricks是否有Jar
作业
超时限制或Jar
作业
可以不受限制地
运行
?我们的应用
程序
启动了长时间
运行
的
spark
作业
,创建了
spark
会话和"fire“子
作业
,但在8月份的发布说明中,我发现notebooks会限制
作业
执行2天。有可能在这样的限制下
运行
流
作业
吗?
浏览 0
提问于2021-09-04
得票数 0
1
回答
在HDinsight上
运行
的
spark
的故障恢复
、
、
我试图按照中的步骤在Azure HDinsight上
运行
Apache
spark
我想知道我是必须自己管理主/从故障恢复,还是由HDinsight来处理。
浏览 0
提问于2015-04-08
得票数 0
1
回答
如何使用Airflow重新启动
失败
的结构化
流
spark
作业
?
、
、
、
我需要在AWS EMR中
运行
结构化
流
spark
作业
。作为弹性需求,如果
spark
作业
由于某些原因而
失败
,我们希望
spark
作业
可以在EMR中重新创建。类似于ECS中的任务编排,如果健康检查
失败
,可以重启任务。然而,EMR更多是一个计算引擎,而不是编排系统。 我正在寻找一些大数据工作流程编排工具,例如Airflow。但是,它不能支持DAG中的循环。
浏览 44
提问于2020-07-13
得票数 1
回答已采纳
3
回答
使用气流
运行
火花
流
作业
?
、
、
我们的hadoop集群中有火花批处理
作业
和和火花
流
作业
。我们遇到了气流,这符合我们对“编写、调度和监控工作
流
的平台”的需求。我只想能够停止和启动火花
流
的工作。使用气流图和剖面图不是什么问题。 我的问题是,除了失去一些功能(图表、分析)之外,为什么我不应该使用气流来
运行
火花
流
作业
?
浏览 1
提问于2019-02-20
得票数 10
1
回答
异常:通过并发更新将org.apache.
spark
.sql.delta.ConcurrentAppendException:文件添加到表的根目录中
、
、
、
我有一个简单的星火
作业
,它将数据流到Delta表。这张表很小,没有分区。按照文档()中的建议,我添加了一个压缩
作业
,每天
运行
一次。.option("dataChange", "false") .mode("overwrite")每次压缩
作业
运行
时,
流
作业
都会得到以下异常: o
浏览 5
提问于2021-08-12
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Azkaban支持哪些类型的作业?
分布式计算框架状态与容错的设计
Spark 运行架构以及常用组件
Spark Streaming与Kafka 整合的改进
Spark Streaming和Kafka集成深入浅出
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券