Spark从资源文件夹加载jar中的csv文件_将资源中的文件夹压缩到jar_从jar中的资源运行SH文件 - 腾讯云开发者社区

python、apache-spark、apache-spark-sql

我已经构建了，并能够使用下面的命令使用同样的pyspark错误获取Traceback (most recent call last): File "<st

浏览 13提问于2015-06-10得票数 26

回答已采纳

2回答

Spark从资源文件夹加载jar中的csv文件

scala、apache-spark

我正在尝试创建一个运行在Scala上的Spark应用程序，它读取位于src/main/resources目录中的.csv文件，并将其保存在本地hdfs实例上。当我在本地运行它时，一切都很有趣，但每当我将其捆绑为.jar文件并将其部署到服务器上时，就会出现问题…… 这是我的代码，位于src/main/scala中，我的数据文件的</em

浏览 80提问于2019-03-07得票数 4

2回答

在命令行上运行时，使用getResourceAsStream()列出的文件为空

java、embedded-resource

我试图在应用程序的jar文件中列出特定路径上的文件。当我使用"mvn干净包“构建时，它可以工作，但是当我在命令行上运行"java -jar目标/myproject_1.0.jar”时，文件列表是空的。而且只有路径列表逻辑失败，因为代码示例末尾的回退代码(读取硬编码的xsd文件名)甚至可以在命令行上工作。另一个可能相关的</em

浏览 2提问于2017-10-10得票数 1

回答已采纳

3回答

使用星火应用程序内置Serde创建的查询蜂巢表

apache-spark、hive、hortonworks-data-platform

我使用Hortonwork的HDP 2.2部署了hadoop集群(Spark1.2.1和Hive 0.14)在应用程序的执行过程中，我没有发现任何jar，也

浏览 10提问于2015-07-02得票数 2

回答已采纳

3回答

未获取架构WASB的FileSystem。Hdinsight Map Reduce

dictionary、hadoop、reduce、azure-hdinsight

我正在Azure HDInsight中运行一个简单的map reduce作业，下面是我们正在运行的命令： java -jar WordCount201.jar wasb://hexhadoopcluster-2019-05-15t07-01-07-193z@hexanikahdinsight.blob.core.windows.net/hexa/CustData.csv wasb://hexhadoopcluster

浏览 29提问于2019-05-16得票数 0

回答已采纳

4回答

通过com.databricks.spark.csv加载RStudio

rstudio、sparkr

我还安装了它的R软件包SparkR，我可以使用它通过火花-壳牌和通过RStudio，然而，有一个区别，我无法解决。./bin/sparkR --master local[7] --packages com.databricks:spark-csv_2.10:1.0.3flights<- read.df(sqlContext, "data/nycflights13.csv",

浏览 0提问于2015-06-16得票数 4

回答已采纳

1回答

在我的应用程序中动态地加载com.databricks:星火-csv星火包

apache-spark、spark-csv

我需要动态地将com.csv星火包加载到我的应用程序中，使用spark提交，它可以工作 --packages com.databricks:spark-csv_2.11:1.4.0 target/scala-2.10/ra-etl_2.10-1

浏览 6提问于2016-08-16得票数 2

1回答

bufferedReader只读取本地csv文件

java、bufferedreader、filereader

我是Java新手，我试图使用这个类返回"test.csv".This的内容，只有当我使用本地文件的路径时才有效。\\test.csv"; BufferedReader wr = null;\test .csv“to”/.csv/test.csv解决方

浏览 5提问于2017-09-21得票数 0

回答已采纳

1回答

针对csv错误发现的Apache多个源

scala、csv、apache-spark、apache-spark-sql

我正在尝试使用submit命令(我正在使用scala)运行spark程序，我指定了主入口、类名、带有所有依赖项的jar文件、输入文件，然后是输出文件，但是我有和错误：线程“主”(org.apache.spark.sql.execution.datasources.v2.csv.CSVDataSourceV2，org.apache.spark.sql.execution.datasources.csv.CSVFile

浏览 5提问于2021-01-03得票数 1

1回答

如何确保我的.jar正在从独立文件中读取数据

java、csv、clojure、leiningen

我有一个在运行前需要读取csv文件的程序。这些数据位于我的clojure项目的一个资源文件夹中。程序运行得很好，当从"resources/data.cv"下载时，这会导致.jar不是独立的，而是需要资源文件夹。如何确保在运行lein uberjar时也编译了这些资源我已经尝试过(csv/slurp-<em

浏览 0提问于2015-07-21得票数 3

3回答

无法在spark2.2中使用SQLContext对象创建数据格式

scala、csv、apache-spark、apache-spark-sql

我在Microsoft 7上使用spark 2.2 version。我希望在一个变量中加载csv文件，以便稍后执行与SQL相关的操作，但无法这样做。我引用了链接中接受的答案，但没有用。下面是创建SparkContext对象和SQLContext对象的步骤：import org.apache.spark.SparkConfval sc=Sp

浏览 4提问于2017-12-25得票数 2

回答已采纳

3回答

如何使用scala将不同的文件名传递给spark

scala、apache-spark、hadoop

()} abc.jar 然而，程序只是尝试从hdfs cluseter的根文件夹中查找路径，并显示未找到异常文件。有没有人可以帮助我使用我提到的文件路径中</

浏览 2提问于2021-09-29得票数 0

1回答

如何从单个目录中仅加载pyspark spark.read.csv中的首n个文件

csv、pyspark、pyspark-sql、apache-spark-2.0

我有一个场景，我正在加载和处理4TB的数据，这是一个文件夹中大约15000个.csv文件。 spark.read.csv。我不能使用正则表达式，因为这些文件是<em

浏览 4提问于2017-10-02得票数 1

3回答

如何将csv文件加载到RStudio上的SparkR中？

r、apache-spark、apache-spark-sql、sparkr

如何将csv文件加载到RStudio上的SparkR中？以下是我在RStudio上运行SparkR所必须执行的步骤。我已经用read.df读取了.csv，不知道还能怎么写。#Set sys environment variables Sys.setenv(SPARK_HOME = "C:/Users/Desktop/spark/spark-1.4.1-bin-hado

浏览 0提问于2015-10-01得票数 5

5回答

运行星火提交时未能加载com.databricks.spark.csv

scala、apache-spark、sbt

spark-submit --class "SampleApp" --master local[2] target/scala-2.11/sample-project_2.11-1.0.jarlibraryDependencies += "org.apache.spark" %% "spark-core" % "1.4.1" libra

浏览 3提问于2016-03-11得票数 3

回答已采纳

3回答

在Pyspark中添加python外部库

pyspark、spark-submit

我使用的是pyspark (1.6)，我想使用databricks:spark-csv库。为此，我尝试了不同的方法，但都没有成功pyspark --jars THE_NAME_OF_THE_JAR ... 14 more 2秒方法:我从下载了一个库压缩文件

浏览 1提问于2017-05-19得票数 2

2回答

Spark Dataset加载多个CSV文件，如果所有文件中的标头不相同，则报告不匹配

hadoop、apache-spark、apache-spark-sql、apache-spark-dataset、apache-spark-2.0

我正在尝试使用spark 2.1.0 API将多个csv文件从hdfs目录加载到Spark DataSet中：在"csvdatatest“文件夹中有多个csv文件

浏览 0提问于2017-11-06得票数 1

2回答

tar + gz文件来自文件夹，因为它不需要放入所有子文件夹中

linux、tar、archive

我们希望tar.gz所有以下的jars文件2.6.4.0-91/spark2/jars/univocity-parsers-4.4.jar2.6.4.0-91/

浏览 0提问于2018-09-06得票数 0

回答已采纳

1回答

对数据帧执行操作时出现Spark* sqlContext异常*

java、apache-spark、apache-spark-sql

当我对拼图文件进行计数时，我得到了下面的错误， java.lang.NoSuchMethodError: org.apache.parquet.schema.Types$MessageTypeBuilder.addFields:126) at org.apache.spark.rdd.RDD.iteratororg.apache.spark.rdd.RDD.computeOr

浏览 19提问于2021-08-06得票数 1

1回答

将已删除的csv文件写入单个文件夹- Pyspark

python、dataframe、pyspark、apache-spark-sql、teradata

当在pyspark中使用partitionby()时，我应该采用什么方法来在一个文件夹而不是多个文件夹中编写csv文件？有什么建议吗？", "terajdbc4.jar")conf.set("spark.driver.extraClass

浏览 5提问于2022-01-31得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在Apache预构建版本中添加任何新的库(如Spark csv)

Spark从资源文件夹加载jar中的csv文件

在命令行上运行时，使用getResourceAsStream()列出的文件为空

使用星火应用程序内置Serde创建的查询蜂巢表

未获取架构WASB的FileSystem。Hdinsight Map Reduce

通过com.databricks.spark.csv加载RStudio

在我的应用程序中动态地加载com.databricks:星火-csv星火包

bufferedReader只读取本地csv文件

针对csv错误发现的Apache多个源

如何确保我的.jar正在从独立文件中读取数据

无法在spark2.2中使用SQLContext对象创建数据格式

如何使用scala将不同的文件名传递给spark

如何从单个目录中仅加载pyspark spark.read.csv中的首n个文件

如何将csv文件加载到RStudio上的SparkR中？

运行星火提交时未能加载com.databricks.spark.csv

在Pyspark中添加python外部库

Spark Dataset加载多个CSV文件，如果所有文件中的标头不相同，则报告不匹配

tar + gz文件来自文件夹，因为它不需要放入所有子文件夹中

对数据帧执行操作时出现Spark* sqlContext异常*

将已删除的csv文件写入单个文件夹- Pyspark

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐