腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
无法
在
spark
Executor
中
创建
DynamoDB
客户端
、
、
、
我需要将流数据加载到
DynamoDB
表
中
。我试过下面的代码。:
DynamoDB
= new
DynamoDB
(client),
executor
5): java.lang.NoClassDefFoundError: C
浏览 4
提问于2017-07-20
得票数 1
1
回答
火花
DynamoDB
连通性问题
、
需求:使用Scala从本地机器读取
DynamoDB
(不是本地的,而是
在
AWS上)的数据。:
无法
在
DynamoDB
中
查找桌面音乐。(Task.scala:121),org.apache.
spark
.
executor
.
Executor
$TaskRunner$$anonfun$10.apply(
Executor
.scala:403),org.apache.
spark
.util.Utils$.tryWith
浏览 0
提问于2020-11-19
得票数 2
1
回答
如何将发电机数据库表
中
的数据读入dataframe?
、
、
、
下面是我试图从发电机数据库
中
读取数据并将其加载到数据帧
中
的代码。 使用scanamo也可以做到这一点吗?编辑-1 现在我可以使用下面的代码
创建
dataframe,并且能够从
dynamodb
表
中
读取数据(如果它不包含null )。(Task.scala:123) at org.apache.
spark
.
executor
.
Executor
$TaskRunner$$anonfun$10.apply(
Executor
.scal
浏览 25
提问于2019-12-17
得票数 1
回答已采纳
1
回答
火花壳适用于适当的纱线资源设置,但不适用于火花提交。
纱线上的火花壳(
客户端
模式)使用$
spark
_HOME/conf/
spark
defaults.conf(
创建
5个执行器)中指定的纱线配置。
spark
.master yarn
spark
.
executor
.cores1
spark
.
executor
.memor
浏览 0
提问于2018-03-04
得票数 2
回答已采纳
1
回答
在对solr进行了几次成功的更新之后,抛出SolrException: java.util.concurrent.TimeoutException:
无法
连接到ZooKeeper
、
、
在
我的应用程序
中
,我使用localhost:2182,localhost:2183连接到solr,使用下面的代码。builder = new CloudSolrClient.Builder(zkHosts, Optional.empty());我使用多个
spark
在
更新失败后,它可以很好地处理一些1100-1300条记录的更新,但出现以下异常: Caused by: org.apache.solr.common.SolrException: java.u
浏览 1
提问于2018-09-20
得票数 0
1
回答
在
Spark
中
对
DynamoDB
进行简单的RDD写入
、
、
、
只是
在
尝试将基本的RDD数据集导入到
DynamoDB
时卡住了。", "table_x")at org.apache.hadoop.
dynamodb
.write.AbstractDynamoDBRec
浏览 0
提问于2016-03-02
得票数 4
1
回答
无法
成功运行从
DynamoDB
读取的AWS作业
、
、
我已经成功地运行了
在
Dynamodb
和AWS重新转换
中
读取我的表的爬虫。表现在在目录
中
。我的问题是当运行Glue作业从
Dynamodb
读取数据到Redshift时。它似乎
无法
从
Dynamodb
中
读取。at org.apache.
spark
.rdd.RDD.iterator(RDD.scala:337) at org.apache.
spark
.shuffle.ShuffleWriteProcessor.writ
浏览 11
提问于2022-02-01
得票数 2
回答已采纳
3
回答
获取emr-ddb-hadoop.jar以连接
DynamoDB
和EMR
Spark
、
、
、
我有一个
DynamoDB
表,需要连接到EMR
Spark
SQL才能在该表上运行查询。我得到了EMR
Spark
Cluster,上面有版本标签emr-4.6.0和
Spark
1.6.1。我指的是文档:
spark
-shell --jars /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jarWarning稍后,当我使用以下命令导入
Dyn
浏览 3
提问于2016-05-06
得票数 5
1
回答
SparkSession应用程序源代码Config属性
在
AWS默认情况下不覆盖JupyterHub & Zeppelin
、
、
、
、
我有星火驱动程序设置使用Zeppelin和或JupyterHub作为
客户端
进行AWS EMR上的交互式火花编程。但是,当我
创建
具有自定义配置属性(应用程序名称、内核#、
executor
ram、# of
executor
、序列化程序等)的SparkSession时,它不会覆盖这些信任的默认值(
在
Spark
UI和
spark
.conf.get(...)
中
的Environment选项卡下确认)。与任何
Spark
一样,EMR上的这些
浏览 0
提问于2019-08-15
得票数 0
2
回答
如何限制木星笔记本的PySpark集群资源?
、
、
、
我希望限制运行在朱庇特笔记本上的PySpark代码的资源使用。我试过了但是它抛出了以下错误:
浏览 6
提问于2020-12-18
得票数 0
回答已采纳
2
回答
在
纱线上以群集模式运行
Spark
时不使用SparkConf设置
、
、
、
"); conf.set("
spark
.driver.memory", "1800m"); conf.set("
spark
.yarn.am.memory", "1800m"); conf.set(&qu
浏览 2
提问于2017-05-04
得票数 5
回答已采纳
2
回答
如何在pyspark
中
设置分割器和减速器的数量
、
、
、
我正尝试
在
amazon EMR实例上运行pyspark以从
dynamodb
读取数据,我想知道如何在我的代码
中
设置拆分和工作的数量?我按照下面两篇文档
中
的说明使用了下面的代码,该代码当前连接到
dynamoDB
并读取数据。": "
dynamodb
", "
dynamodb
.input.tableName": "Table1", "
dynamodb
.endpoint&
浏览 2
提问于2017-12-03
得票数 0
1
回答
Spark
+Mesos初始作业未接受任何资源;请检查群集UI以确保工作进程已注册并具有足够的资源
、
、
、
我
在
云上有一个主人,有3个主人和10个奴隶。所有从属设备都显示为活动状态,但在Mesos Master UI中分配的资源为0:
在
主页上,我可以看到10个激活的代理,但其中9个
无法
访问:我试图
在
集群上运行的作业永远停留在运行状态
Spark
需要启动并运行(
在
每个从服务器上运行start-slve.sh),还是mesos需要?会出什么问题呢?
浏览 3
提问于2020-09-02
得票数 0
2
回答
星团模式下环境变量的设置
、
、
我正在浏览这个,它提到:
在
cluster模式下在纱线上运行
Spark
时,需要使用conf/
spark
-defaults.conf文件
中
的
spark
.yarn.appMasterEnv.另外,如果我
创建
自己的自定义conf文件,并将其指定为--configurations的一部分(
在
星火提交
中
),它会解决我的用例吗?
浏览 3
提问于2017-11-28
得票数 4
1
回答
更改闪烁
中
的JVM时区
、
、
我正拼命地试图更改Sparklyr
中
JVM的时区(使用
spark
2.1.0)。我要GMT无处不在。我正在设置:
在
我的
spark
_config()文件
中
,但不幸的是,
在
Spark
中
,我仍然(
在
System下)看到user.timezone被设置为America/New_York。
浏览 0
提问于2018-09-14
得票数 2
回答已采纳
1
回答
警告cluster.YarnScheduler:初始作业未接受任何资源
、
、
、
我
在
发火星雨的工作。 您可以从作业时间线中注意到,它无限期地运行,没有添加或删除任何资源。
浏览 7
提问于2017-06-16
得票数 7
回答已采纳
1
回答
如何在
Spark
executor
崩溃后重新启动它(
在
YARN
客户端
模式下)?
、
、
、
有可能在
Spark
executor
崩溃后重新启动它吗?我知道失败的任务会在现有的工作
Spark
executor
中
重新运行,但我希望有一种方法可以重新启动崩溃的
Spark
executor
。
在
客户端
模式下,我
在
YARN上运行pyspark 1.6
浏览 16
提问于2016-07-31
得票数 2
回答已采纳
1
回答
是什么控制了一个应用程序拥有多少星团?
、
在用于静态分区的docs 的这一页
中
,它说“使用这种方法,每个应用程序都会获得它可以使用的最大资源数量”。 我只是在想,这些最大的资源是什么?
在
另一个类似的注意事项上,是否有办法改变每个作业或任务级别上所要求的内存?
浏览 3
提问于2015-01-14
得票数 10
回答已采纳
4
回答
如何在
Spark
单机版上调试
Spark
应用?
我正在尝试使用一个主节点和几个工作节点在集群上调试
Spark
应用程序。我已经成功地使用
Spark
独立集群管理器设置了主节点和工作节点。我下载了包含二进制文件的
spark
文件夹,并使用以下命令设置工作节点和主节点。这些命令是从
spark
目录执行的。./bin/
spark
-class org.apache.
spark
.deploy.worker.Worker master-URL./sbin/
spar
浏览 0
提问于2015-03-17
得票数 21
1
回答
将dataframe写入Ceph存储时出错
、
、
、
在
我的组织
中
,我目前正在探索如何使用Ceph来取代HDFS来运行AI/ML工作负载。作为该计划的一部分,我们设置了一个Ceph集群,并使用Rook将其导入到Kubernetes
中
。
在
我使用Ceph进行测试的过程
中
,我能够使用Kubernetes上的
Spark
访问Ceph Storage,也能够使用S3CMD读取数据。但是,我
在
将数据写回Ceph Storage时遇到错误。下面是我
在
写回数据时得到的代码和错误。希望有人能帮上忙。",
浏览 2
提问于2021-03-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【云原生】Spark on k8s 讲解与实战操作
Spark 运行架构以及常用组件
spark安装和提交程序测试,占用大数据最多的节点他的魔力展现在哪里?
大数据基础:Spark工作原理及基础概念
Zzreal的大数据笔记-SparkDay01
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券