腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
当
文件大小
大于
spark
中
的
群集
内存大小
时会
发生
什么
?
我很想了解
spark
框架在
文件大小
大于
集群
内存大小
时
的
行为。假设集群中有2个节点,内存为64 GB ( 32 GB +32 GB),要处理
的
文件为100 GB。我读到Node
中
50%
的
内存被分配为RDD持久化
的
存储内存,而Node
中
剩余
的
50%
的
内存被分配为工作内存。工作内存可以上下浮动,并且可以占用存储内存(如果可用)。在这种情况下,
spark
会处理100 GB
浏览 21
提问于2020-07-24
得票数 0
2
回答
即使在应用程序
中
设置内核时,
Spark
也会显示0核
、
、
、
、
我遇到了一个奇怪
的
问题:在星火主url上运行一个应用程序,其中UI无限期地报告“等待”
的
“状态”,因为无论我将核心计数配置为
什么
,都会在运行
的
应用程序表下显示0核心。我已经用以下设置配置了我
的
应用程序,其中
spark
.max.cores =2&
spark
.default.cores =2&内存设置为3GB。
Spark
-defaults.conf
spark
.yarn.max_executor.failures
浏览 7
提问于2016-02-03
得票数 4
2
回答
星火数据集超过内存总大小
、
、
我最近在火花中工作,遇到了一些我仍然无法解决
的
问题。 我已经通过了下面的链接,但这
浏览 0
提问于2018-04-17
得票数 2
1
回答
如果您向共享内存写入
的
数据
大于
其大小,会
发生
什么
情况?尝试使用非常大
的
数据。你能走到
什么
程度?
、
我想知道当在共享内存上写入
的
数据大小
大于
共享
内存大小
时会
发生
什么
浏览 0
提问于2015-11-14
得票数 0
1
回答
ADLS
中
的
parquet文件
的
分区数是否与将其作为dataframe读取后
的
分区数相同?
、
、
我在ADLS中有3个拼花文件 2块文件有10个子块文件,当我在数据库
中
读取它时,分区
的
数量等于10个,这是预期
的
行为。第三个文件有172个 snappy.parquet文件,当我将它作为一个数据文件读取时,分区
的
数量等于89,原因是
什么
?使用此命令df.rdd.getNumPartitions()查找数据格式
的
分区数。
浏览 1
提问于2022-07-17
得票数 1
回答已采纳
1
回答
理解火花大师
、
我有一个简单
的
spark
应用程序,从一个配置文件
中
读取主程序: .setMaster(config.getString(
SPARK
_MASTER))当我运行我
的
应用程序
时会
发生
什么
,如下所示:
spark
-submit --class <main class> --maste
浏览 2
提问于2016-03-09
得票数 1
回答已采纳
1
回答
当
Spark
从S3读取大文件时,数据是否可以分布到不同
的
节点
、
、
假设我在S3上有一个很大
的
数据文件,想要将它加载到
Spark
集群中进行一些数据处理。当我使用sc.textFile(文件路径)将文件加载到RDD
中
时,我
的
集群
中
的
每个节点是否会存储我
的
文件RDD
的
一部分并分布在节点上?或者整个数据文件将存储在一个节点中并在
群集
上复制?如果
文件大小
大于
该节点
的
内存,该怎么办? 谢谢!
浏览 13
提问于2018-03-01
得票数 1
回答已采纳
1
回答
小精灵段大小与
文件大小
我已经阅读了几份ELF规范文件,但还没有找到以下问题
的
答案3)在精灵可执行文件
中
识别.const段
的
正确方法是
什么
?每个部分
的
标志值没有这样
的
信息,而且似乎
浏览 2
提问于2014-05-27
得票数 5
1
回答
在
Spark
中
对DataFrame进行排序时,幕后会
发生
什么
?
在
Spark
中
对DataFrame进行排序时,幕后会
发生
什么
?例如,df.sort(i) 我知道
当
您将数据读取到DataFrame
时会
发生
什么
,但是我很好奇
当
您排序
时会
发生
什么
与MapReduce相比有
什么
不同?
浏览 2
提问于2018-08-14
得票数 0
1
回答
当
核心
群集
组失败到另一个节点
时会
发生
什么
?它会把整个星系团打倒吗?单一
的
失败点?
、
、
、
、
http://bit.ly/1lKJFIa“
群集
组”故障转移将导致
群集
脱机。真的?单一
的
失败点?我是不是遗漏了
什么
?
当
核心
群集
资源(
群集
组)从一个节点转移到另一个节点
时会
发生
什么
?
浏览 0
提问于2014-08-10
得票数 0
1
回答
使用jboss部署WAR文件需要大量内存。
、
、
、
、
我使用通配符应用服务器,
当
使用命令行接口(命令行接口,CLI)部署war文件时,进程要求
的
堆大小
大于
的
10倍war
文件大小
。如何减少jboss在部署期间使用
的
内存大小
。问题细节: 我必须部署8个war文件,每个文件100 MB,这个进程被应用在一个使用“批处理”和"batch.run“
的
事务
中
,该进程占用
的
内存超过8GB。我
的
问题是,在使用jboss时,如何减少通配符占用
的</em
浏览 1
提问于2017-01-07
得票数 1
2
回答
当
核心
群集
组失败到另一个节点
时会
发生
什么
?它会把整个星系团打倒吗?单一
的
失败点?
、
单一
的
失败点?我是不是遗漏了
什么
?
当
核心
群集
资源(
群集
组)从一个节点转移到另一个节点
时会
发生
什么
?它会把整个星系团打倒吗?谢谢
浏览 0
提问于2014-08-10
得票数 1
回答已采纳
1
回答
添加:
spark
.yarn.submit.waitAppCompletion=false
的
影响是
什么
?
、
、
我正在尝试理解在提交
spark
步骤时添加:
spark
.yarn.submit.waitAppCompletion=false配置会有
什么
影响。据我所知,如果它设置为true,客户端进程将保持活动状态,报告应用程序
的
状态。否则,客户端进程将在提交后退出。
当
群集
具有KeepJobFlowAliveWhenNoSteps = False并且提交
的
步骤具有
spark
.yarn.submit.waitAppCompletion=false属性时,会
发生<
浏览 131
提问于2020-05-03
得票数 2
1
回答
PDF合并正在增加
文件大小
、
、
、
我将几个pdf页面合并到一个文件
中
。合并本身运行良好。所有页面都在正确
的
位置,并且看起来都很正确。writeContext);}CFRelease(writeContext); 在合并之后
发生
的
奇怪
的
事情是,最终文档
的
文件大小
远远
大于
所有单个页面的
文件大小
的
总和。10兆字节,但合并后<e
浏览 14
提问于2016-06-09
得票数 0
3
回答
PHP上传图片宽度
大于
2000像素导致崩溃
、
、
、
当用户将图像上传到我
的
服务器(共享服务器)时,
当
文件
的
宽度
大于
2000像素时,服务器会发出错误。这与
文件大小
无关--我可以上传一个1MB
的
文件,宽度为2000,但它仍然会崩溃。如果我上传一个1000像素
的
1mb文件,它工作得很好。我使用
的
是SimpleImage插件()和CakePHP框架。 我同时阅读
浏览 1
提问于2011-12-04
得票数 1
回答已采纳
1
回答
错误:允许
内存大小
为67108864字节
、
、
当我上传一张照片我犯了个错误我使用共享服务器。我
的
.htaccess是: RewriteEngine on RewriteRule ^$ webroot/ [L]
浏览 6
提问于2010-10-08
得票数 6
回答已采纳
1
回答
Spark
和SparklyR错误“超过64 KB”
、
在使用SparklyR和
Spark
2.0.2调用逻辑回归后,我在
Spark
上得到以下错误。ml_logistic_regression(Data, ml_formula)Error: org.apache.
spark
.SparkException: Job aborted due to stage failure: Task 13 in stage/sql/catalyst/InternalRow;)
浏览 0
提问于2017-04-05
得票数 2
1
回答
数据库
中
的
addSparkListener等价
、
、
、
我想在Databricks
的
spark
上下文中注册自定义SparkListener。 与基本火花,我可以使用"
spark
.jars“和"
spark
.extraListeners”吐露在火花-提交。对于databricks安装程序,我已经在集群
中
安装了包含监听器
的
jar。当我将配置"
spark
.extraListeners“放在集群
的
”高级“配置选项卡
中
时,集群无法初始化抛出错误侦听器。我试着在火花会话构建
浏览 14
提问于2022-02-03
得票数 2
1
回答
在处理分配给我
的
桶
中
的
所有urls之后,我
的
喷口线程会在风暴爬虫中保持空闲吗?
、
、
1)
当
数据库
中
的
存储桶数
大于
线程数
时会
发生
什么
?2)如果只有一个桶中有urls,但是有10个threads..will,剩下
的
9个线程处于空闲状态
时会
发生
什么
?
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
当
部署在纱线
中
时,Apache如何处理系统故障?
、
、
先决条件案例与问题 hadoop集群
的
一个节点由于磁盘错误而失败。复制是,不够高,数据丢失。简单地说,flow已经找不到一个预先配置为工作流资源
的
文件了。
当
二级namenode也失败<e
浏览 2
提问于2014-07-15
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
万亿级数据规模下的倾斜调优
Apache Spark 2.3 加入支持Native Kubernetes及新特性文档下载
Zzreal的大数据笔记-SparkDay01
Apache Spark 统一内存管理模型详解
Python列表对象实现原理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券