腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Spark
-
GraphX
与
spark-submit
的
性能
差异
、
、
我们已经使用
Spark
1.6.1和Scala2.10编写了一些代码来通过
GraphX
连接和链接数据集。如果我们在
spark
-shell中运行这段代码,它将在30分钟内完成,具有10个执行器,10g内存和每个执行器5个cpu。如果我们使用
spark-submit
在一个fat jar中运行它,那么这个过程就会因为内存不足错误而失败,并且需要一个半小时才能到达那个点。 有没有人知道这可能是什么原因?有谁知道SparkContext和SQLContext是如何在shell中设置
的
,以及我们在设置自己
的<
浏览 18
提问于2017-02-02
得票数 1
回答已采纳
1
回答
为emr上
的
``
spark
submit`作业指定marksweep
、
、
、
在emr上运行
spark-submit
作业时,我如何指定希望jvm使用MarkSweep gc?我可以
与
作业(即
spark-submit
-- conf...)一起提交它吗?如果可以,命令是什么?这是否必须在
spark
启动时设置,如果是,我如何在emr配置中指定? 谢谢!
浏览 5
提问于2019-03-26
得票数 0
回答已采纳
2
回答
火花-提交java.lang.ClassNotFoundException
、
我试图以独立
的
模式执行
spark
submit,我
的
项目在IntelliJIdea工具中编译成功,我还创建了相关
的
jar文件,但当我尝试运行以下内容时: [cloudera@quickstart bin]$
spark-submit
--verbose --class
graphx
/home/cloudera/ideaProjects/grafoTelefonos/target/
graphx
-1.0->
浏览 3
提问于2016-05-05
得票数 2
回答已采纳
1
回答
如何在Google平台上提交星火图形作业示例?
、
、
、
我在Google平台上创建了一个集群,有五个基于linux
的
虚拟机(VM):一个主服务器和4个工作人员。我在主VM上运行./start-master.sh,在worker VM上运行./bin/
spark
-submit.运行一个已经在
Spark
中
的
PageRank算法./bin/
spark-submit
\ --master <maste
浏览 6
提问于2021-02-07
得票数 1
回答已采纳
1
回答
从内存错误中触发
GraphX
、
我正在运行
GraphX
上
的
星火
与
输入文件大小约100 of
的
aws EMR。我
的
集群配置如下:节点- 10内存-122 My每个HDD -320 My每个
spark-submit
--deploy-modecluster \ncgaka-
graphx
-assembly-1.0.jar tr
浏览 0
提问于2016-09-21
得票数 0
回答已采纳
1
回答
团簇(纱线)模式下火花放电
的
Kerberos问题
、
、
、
我正在使用带有Kerberos身份验证
的
Spark
。
spark-submit
--class "
graphx
_sp" --master local[16] --driver-memory 20G target/scala-2.10/
浏览 5
提问于2016-12-05
得票数 3
回答已采纳
2
回答
如何在
spark
中找到action
的
job id?
、
、
我想取消
spark
中
的
一个作业,因为有时它需要更多
的
时间,而且还没有完成。当我们调用一个操作时,就会创建一个作业。例如,当我调用collect时,它需要更多
的
时间才能完成。我想取消此操作
的
作业。我不使用
spark-submit
,我在Scala代码中创建SparkContext。我
的
应用程序是一个基于
GraphX
的
web应用程序。 我如何在
spark
中做到这一点?
浏览 52
提问于2020-06-28
得票数 1
回答已采纳
1
回答
Neo4j可以和Hadoop一起工作吗?
、
Neo4j能否
与
Hadoop协同工作,用于大数据
的
社交网络分析?如果是,是否很难让它们协同工作,以及这样一个系统
的
瓶颈是什么?基本上,我正在寻找一种用于大数据
的
社交网络分析
的
解决方案,该网络可以是数亿个顶点。我也期待一个用户友好
的
图形交互浏览和分析图形界面。Hadoop+Neo4j能满足上述目的吗?或者Hadoop+Griph或
Spark
+
GraphX
是更好
的
解决方案? 任何意见或建议都将不胜感激。谢谢。
浏览 2
提问于2015-02-26
得票数 1
1
回答
声明类型为Edge
Graphx
的
空数组
、
、
、
我正在从文件中读取数据来创建图形
的
边缘。我已经声明了一个数组,并一个一个地在其中添加边。edgeArray = edgeArray ++ Array(Edge(VertexId, VertexId, edgeProperty("", "")) ) 但是,在第一行中,我不需要用虚拟值声明额外
的
边<:org.apache.
spark
.
graphx
.Edge_ [org.apache.
spark
.
graphx
.Edge_ >:(Long,Lo
浏览 0
提问于2018-05-05
得票数 0
回答已采纳
1
回答
ModuleNotFoundError:没有名为“graphframes”
的
模块
、
、
、
我找到了这个answer,并按照它
的
说明操作,但它不起作用。这是我
的
代码hello_
spark
.py import pyspark from graphframes import * 当我使用此命令运行时:
spark-submi
浏览 86
提问于2021-04-07
得票数 0
回答已采纳
1
回答
Apache zepplin
spark
作业运行速度比
spark-submit
快
、
、
我想知道为什么我在Zepplin段落中写
的
spark
作业
的
执行速度比运行
spark-submit
要快得多?我基本上在Zepplin和
spark-submit
中使用相同
的
配置(执行器、内存),但是在执行时间上有很大
的
不同。如何解释这种
差异
?
浏览 0
提问于2016-12-28
得票数 2
1
回答
如何在集群中高效地执行
spark
程序
然后打开主机1(这是集群
的
namenode )终端&运行
spark
命令,如因此,实际上只有一个节点正在执行程序(主机2)。为什么?有没有办法让我
的
驱动程序也能执行这个程序。这样它就跑得更快了?
浏览 2
提问于2016-12-28
得票数 0
回答已采纳
2
回答
SparkContext和SparkSession :如何获得"parallelizePairs()"?
、
首先,我让我
的
司机: .builder() .config("driver", "org.postgresql.Driver")但是
spark
没有我需要
的
功能。首先,我从不需要JavaSparkContext,因为我使用
spark-submit
浏览 2
提问于2017-09-10
得票数 2
回答已采纳
3
回答
纱线上火花
的
性能
问题
、
我们正尝试在yarn上运行我们
的
spark
集群。我们有一些
性能
问题,特别是
与
独立模式相比。 我们有一个由5个节点组成
的
集群,每个节点都有16 We
的
RAM和8个核心。根据我
的
理解,我们
的
任务应该分配4个14 of
的
容器。但是
spark
UI只显示了3个每个7.2 UI
的
容器。 我们无法确保分配给它
的
容器数量和资源。
与
独立模式相比,这会导致有害
的
<
浏览 1
提问于2015-02-05
得票数 9
3
回答
Apache :客户端和集群部署模式
的
不同
、
我们有一个星火独立
的
集群,有三台机器,所有这些机器都有
Spark
1.6.1: (...)对于独立集群,
Spark
目前支持两种部署模式。在客户端模式下,驱动程序在
与
提交应用程序
的
客户端相同
的
进程中启动。但是,通过阅读这篇文章,我并不真正理解实际
的
差异
,我也不明白不同部
浏览 5
提问于2016-05-04
得票数 40
回答已采纳
3
回答
设置星火NoSuchMethodError图时获取
GraphX
、
、
我得到一个类似的错误遇到
的
-我可以运行
GraphX
使用火花外壳,但我得到一个NoSuchMethodError时,我试图使用火花提交
的
jar文件。)Exception in thread "main" java.lang.NoSuchMethodError: org.apache.
spark
.
graphx
.._ import org.apache.
spark
浏览 5
提问于2015-02-18
得票数 2
回答已采纳
1
回答
用空值填充
的
GraphX
顶点
、
、
我正在尝试一个在星火
GraphX
和有困难
的
零代码。map at <console>:51 res77: org.apache.
spark
.rdd.RDD[org.apache.
spark
.
graphx
.Edge[Boolean[(String, Long),Boolean] = org.apache.
spark
.
graphx
.impl.GraphImpl@9533103 如果我拉出顶点属性,我就得到了一些空值。MapP
浏览 2
提问于2018-04-19
得票数 1
回答已采纳
1
回答
AWS EMR step Vs命令行火花-提交
、
在EMR集群
的
主节点上提交EMR步骤
与
运行火花提交步骤有什么区别?EMR step aws emr add-steps --cluster-id j-2AXXXXXXGAPLF --steps Type=
Spark
,Name="
Spark
Program",ActionOnFailure=CONTINUE,Args=[--class,org.apache.
spark
.examples.SparkPi,/usr/lib/
spark
/
浏览 5
提问于2021-11-09
得票数 1
回答已采纳
2
回答
spark-submit
和pyspark有什么区别?
、
、
如果我启动pyspark,然后运行以下命令:Command: /usr/local/
spark
/bin/
spark-submit
my_script.py collapse= Sparker(sc)
浏览 0
提问于2014-11-04
得票数 20
1
回答
GraphLoader对象中
的
抽象方法错误
、
、
我已经在
Graphx
中创建了一个简单
的
项目,当我试图运行这个测试项目时,我得到了AbstractMethodError,这个方法edgeListFile内部出现错误,看起来像是
与
记录器相关
的
东西,我不是abe看到
的
,请帮助我。这是我
的
.scala file object graphtest extends App { import org.apache.
spark
.
graphx
.org.apache.
spark
.interna
浏览 23
提问于2019-02-05
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券