User类引发异常: org.apache.spark.sql.AnalysisException:无法推断拼图的架构。必须手动指定

java、apache-spark、bigdata、parquet

spark.read().parquet(configuration.getInputDataLocation())；但是inputDataLocation( Azure Storage Account容器中的一个文件夹)可能没有任何数据，在这样的用例中会抛出异常，User类抛出异常: org.apache.spark.sql.AnalysisException: Unable to infer schema for必须手动

浏览 63提问于2021-11-18得票数 0

回答已采纳

1回答

如果文件夹是空的，如何正确读取假定包含Parquet文件的文件夹

apache-spark、parquet

当我试图读取一个文件夹，这个文件夹应该包含Parquet格式的文件，如果有数据，如果没有数据，那么第一行就会出错，后续代码也不会执行。错误: org.apache.spark.sql.AnalysisException:无法推断Parquet的架构。必须手动指定。处理这种情况的正确方法是什么。

浏览 0提问于2018-11-22得票数 3

回答已采纳

1回答

如何在Azure数据库中使用JDBC从PostgreSQL中读取表数据？

apache-spark、pyspark、apache-spark-sql、azure-databricks

我正在尝试使用pyspark读取Azure云订阅中可用的postgreSQL表，但是得到了下面的错误。我知道，当我们使用load函数时，我们也应该包括这个格式。但是由于这个PostgreSQL实例可以在不同的azure订阅中使用，所以我根本无法访问PostgreSQL数据库，如果是这样的话，如何推断模式呢？或者是否有更好的方法从databricks读取数据。df = spark.read.option("url", "jdbc:postgresql://{

浏览 6提问于2020-09-05得票数 0

1回答

无法仅在计划作业运行时推断Parquet的架构

databricks、azure-databricks

我正在运行一个通过dbutils.notebooks.run()命令执行其他笔记本的记事本。每当我手动运行此作业时，它都会执行，不会出现任何问题。每当作业夜间运行时，短暂的笔记本就会返回错误。org.apache.spark.sql.AnalysisException:无法推断Parquet的架构。必须手动指定。通过增加集群上的工作人员数量，我能够解决其他一些遇到错误的

浏览 3提问于2020-05-18得票数 0

1回答

无法推断Parquet的架构。必须手动指定。

apache-spark、amazon-s3、pyspark、parquet、amazon-emr

.;请帮帮我。谢谢!！

浏览 3提问于2021-01-01得票数 3

回答已采纳

2回答

使用嵌套s3文件夹中分区Parquet文件的AWS胶水作业失败

directory、schema、parquet、aws-glue

当在分区的Parquet文件上运行胶水作业时，我会得到以下错误，无法推断parquet的架构。必须手动指定。如果我的所有数据都在一个文件夹中，我可以通过胶水将文件加载到Redshift中。但是当我指向一

浏览 0提问于2019-01-17得票数 0

回答已采纳

1回答

从SQL查询中触发Dataframe

sql、scala、apache-spark、db2、parquet

我尝试使用Apache，以便像在DataFrame中讨论的那样，将具有多个联接和子选择的(大型) SQL查询的结果加载到中。不幸的是，我这样做的尝试导致了Parquet的错误：线程“主”org.apache.spark.sql.AnalysisException中的异常:无法推断Parquet的架构。必须手动指定</

浏览 1提问于2019-07-09得票数 0

回答已采纳

1回答

无法在数据库中从CSV创建表

python、sql、azure、databricks、azure-databricks

我正在尝试从存储在Azure存储帐户中的CSV文件创建一个表。我正在使用下面的代码。我正在使用Azure数据库。笔记本是用Python写的。无法推断CSV的架构。它必须手动指定。任何知道如何解决这个错误的人。

浏览 11提问于2022-11-28得票数 0

2回答

pyspark.sql.utils.AnalysisException：“无法推断CSV的架构。必须手动指定它。”

csv、file、apache-spark、pyspark、schema

运行时有读取模式的方法吗？

浏览 6提问于2022-01-21得票数 1

2回答

SparkR读写数据发布

r、sparkr

我有一个火花DataFrame，我想写到我的光盘，我使用了以下代码-它已经完成，我可以看到一个新的文件夹中创建了一个_SUCCESS文件。：org.apache.spark.sql.AnalysisException:无法在d

浏览 0提问于2016-09-17得票数 1

回答已采纳

1回答

能够读进RDD，但不能读到火花数据格式

azure、pyspark

") %%pyspark from pyspark.sql.type

浏览 3提问于2022-01-25得票数 0

2回答

如何指定模式，同时读取拼花文件？

hadoop、apache-spark、pyspark、parquet

在使用scala或pyspark读取存储在hadoop中的拼花文件时，会发生以下错误：var dff = spark.read.parquet("/super/important/df") org.apache.spark.sql.AnalysisException: Unable to infer schema for Parquet.org.apache.spark.sql.DataFrameReader.parquet(DataFrameReader.scala:425)

浏览 1提问于2017-07-20得票数 3

回答已采纳

2回答

“无法推断JSON的模式”PySpark中的错误？

json、file、apache-spark、pyspark、schema

pyspark一起读取为：但是它会导致这个错误：当我在主文件中创建一个记录计数较小的json文件时，这段代码可以读取该文件。

浏览 5提问于2022-11-01得票数 1

1回答

Python检查: Literal[False]、重载和NoReturn

python、pyright

NoReturn" is incompatible with type "None"我对此感到困惑--显然，Pyright无法确定如果条件为

浏览 6提问于2021-12-12得票数 6

回答已采纳

1回答

更改用户定义函数的错误类型

python、error-handling

是否存在将捕获错误并将其作为不同错误引发的场景。=sheet) raise ValueError("Sheet {0} not in {1}".format(sheet,path)))except XLRDError:

浏览 1提问于2019-04-09得票数 0

回答已采纳

2回答

如何使用PySpark读取目录下的Parquet文件？

python、pyspark、apache-spark-sql、databricks、azure-databricks

我在网上搜索过，网上提供的解决方案没有解决我的问题。我试图读取一个目录下的拼板文件，这是分层的。我得到了以下错误。在“年”文件夹下将有多个月的

浏览 7提问于2020-08-25得票数 1

回答已采纳

1回答

从JSON创建一个对象(GSON: java.lang.IllegalStateException: BEGIN_OBJECT，但是STRING)

java、json、parsing、gson、type-conversion

我希望使用我使用HttpUrlConnection构建的客户端应用程序读取REST服务的GET方法的结果。该方法返回有关用户的信息。阅读后，我希望创建一个用户类型的对象，并填充该用户的所有信息。我用的是GSON。Object object = gson.fromJson(json, User.class); System.out.println所有

浏览 1提问于2013-03-31得票数 4

1回答

SqlBulkTools -更新

c#、sql、sqlbulkcopy、bulkupdate

当我试图运行时，我会得到以下错误：但是我在“business”类中定义了变量的类型。

浏览 2提问于2020-06-24得票数 3

4回答

在Java中引发自定义异常

java

为什么在尝试抛出自定义异常时需要用try/catch包装抛出的自定义异常，但对于泛型异常不需要这样做？如示例中所示，我的Exception子类： public MyException(String msg){ }抛出异常： private static void testex(St

浏览 2提问于2012-05-14得票数 14

回答已采纳

1回答

托管类库项目中的ASP.NET核心2

c#、asp.net-core

我需要从类库项目中的一个类(目标4.7.2)创建ASP.NET核心2.1WebAPI。以下调用引发异常：无法加载文件或程序集'System.Runtime.InteropServices.RuntimeInformation系统找不到指定的文件。System.IO.FileNotFoundException' occurred in Mic

浏览 0提问于2018-09-25得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如果文件夹是空的，如何正确读取假定包含Parquet文件的文件夹

如何在Azure数据库中使用JDBC从PostgreSQL中读取表数据？

无法仅在计划作业运行时推断Parquet的架构

无法推断Parquet的架构。必须手动指定。

使用嵌套s3文件夹中分区Parquet文件的AWS胶水作业失败

从SQL查询中触发Dataframe

无法在数据库中从CSV创建表

pyspark.sql.utils.AnalysisException：“无法推断CSV的架构。必须手动指定它。”

SparkR读写数据发布

能够读进RDD，但不能读到火花数据格式

如何指定模式，同时读取拼花文件？

“无法推断JSON的模式”PySpark中的错误？

Python检查: Literal[False]、重载和NoReturn

更改用户定义函数的错误类型

如何使用PySpark读取目录下的Parquet文件？

从JSON创建一个对象(GSON: java.lang.IllegalStateException: BEGIN_OBJECT，但是STRING)

SqlBulkTools -更新

在Java中引发自定义异常

托管类库项目中的ASP.NET核心2

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐