首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >数据过程中的Spark初始化失败- java.util.ServiceConfigurationError

数据过程中的Spark初始化失败- java.util.ServiceConfigurationError
EN

Stack Overflow用户
提问于 2021-07-15 04:45:43
回答 1查看 89关注 0票数 2

正在尝试对dataproc运行spark作业。但这项工作甚至未能初始化spark context。

当使用yarn-client作为主机创建spark context时,我得到以下错误:

代码语言:javascript
运行
复制
        SparkSession sparkSession = SparkSession.builder()
                .appName("Sample App")
                .master("yarn-client")
                .getOrCreate();
代码语言:javascript
运行
复制
ERROR org.apache.spark.SparkContext: Error initializing SparkContext.
java.util.ServiceConfigurationError: org.apache.spark.scheduler.ExternalClusterManager: Provider org.apache.spark.scheduler.cluster.k8s.KubernetesClusterManager not a subtype
    at java.util.ServiceLoader.fail(ServiceLoader.java:239)
    at java.util.ServiceLoader.access$300(ServiceLoader.java:185)

当我没有设置主节点或传递local时,当我提交作业时,我会得到下面的错误:

代码语言:javascript
运行
复制
ERROR org.apache.spark.SparkContext: Error initializing SparkContext.
java.util.ServiceConfigurationError: org.apache.hadoop.fs.FileSystem: Provider com.google.cloud.hadoop.fs.gcs.GoogleHadoopFileSystem could not be instantiated
    at java.util.ServiceLoader.fail(ServiceLoader.java:232)
    at java.util.ServiceLoader.access$100(ServiceLoader.java:185)

根据我的理解,这个错误应该不会出现,因为Google云存储连接器是自动安装/配置在dataproc中的,所以我为什么会看到这个错误。

关于如何解决这些错误以及它们的含义的任何指导。

EN

Stack Overflow用户

发布于 2021-07-16 03:55:57

您不需要.master("yarn-client"),只需删除该行即可。Spark on Dataproc已配置为默认使用YARN作为集群管理器。以下是相关属性:

代码语言:javascript
运行
复制
spark.master=yarn
spark.submit.deployMode=client

如果您确实想显式设置master,正确的值应该是"yarn“而不是"yarn-client”。

有关更多详细信息,请参阅此doc

票数 0
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68384888

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档