开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

Spark: spark-submit使用哪个目录来查找--文件？

在Spark中，spark-submit命令用于提交Spark应用程序到集群上运行。它使用--files选项来指定要在集群上分发的文件。spark-submit使用以下目录来查找这些文件：

当前工作目录：spark-submit首先在当前工作目录中查找指定的文件。当前工作目录是运行spark-submit命令的目录。
Spark配置目录：如果文件在当前工作目录中找不到，spark-submit将在Spark配置目录中查找。Spark配置目录是通过SPARK_CONF_DIR环境变量指定的，默认情况下为$SPARK_HOME/conf。
Spark安装目录：如果文件既不在当前工作目录中，也不在Spark配置目录中，spark-submit将在Spark安装目录中查找。Spark安装目录是通过SPARK_HOME环境变量指定的。

需要注意的是，--files选项指定的文件将被分发到集群上的每个工作节点，并在应用程序中可用。这些文件可以是应用程序所需的任何资源，如配置文件、数据文件等。

推荐的腾讯云相关产品是腾讯云的云服务器CVM和弹性MapReduce（EMR）服务。

腾讯云云服务器CVM：腾讯云提供的弹性、可扩展的云服务器，可满足各种计算需求。您可以使用CVM来部署和运行Spark应用程序，并通过spark-submit命令将应用程序提交到CVM集群上运行。
腾讯云弹性MapReduce（EMR）：腾讯云的大数据处理和分析服务，提供了完全托管的Spark集群。您可以使用EMR来轻松地创建和管理Spark集群，并使用EMR的控制台或API提交Spark应用程序。

您可以通过以下链接了解更多关于腾讯云云服务器CVM和弹性MapReduce（EMR）的信息：

腾讯云云服务器CVM产品介绍：https://cloud.tencent.com/product/cvm
腾讯云弹性MapReduce（EMR）产品介绍：https://cloud.tencent.com/product/emr

相关搜索:Spark-submit在错误的目录中查找无法使用spark-submit使用本地文件 airflow spark-submit operator -无此类文件或目录 google dataproc:使用哪个spark目录来设置$SPARK_HOME环境变量？linux 查找文件在哪个目录 linux查找文件在哪个目录使用python可执行文件提交Spark作业，而不是spark-submit 如何使用Spark来洗牌大文件？文件名、目录名或卷标语法不正确。在使用spark-submit时 Databricks:使用外部jar文件运行spark-submit作业，‘无法加载类’错误如何在Scala Spark中使用window lag来查找更改 FileNotFoundError:在Heroku上运行pyspark命令时，未遇到用于spark-submit的此类文件或目录如何使用SparkSession的自定义配置文件(不使用spark-submit提交申请)？使用spark群集模式将文件写入unix目录使用Scala/Spark列出目录中的文件(包括文件信息)使用ajax查找目录中的文件数通过使用linux_rename命令添加时间戳来查找目录中的文件使用查找和重命名来重命名子目录中的文件我可以使用哪个工具来查看WRX文件？如何使用spark-submit运行转换为二进制的.py文件(在linux中)

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

没有搜到相关的文章

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

热门标签

活动推荐

运营活动

活动名称

广告关闭