spark.sql无法执行基本SQL调用。问题来自_在执行基本的add语句后，如果save change调用超时，会出现问题 - 腾讯云开发者社区

sql、apache-spark

我基本上想要得到5星和1000多条评论的餐厅的名字，星的数量和评论的数量。def fiveStarBusinessesSQL():DataFrame = { spark.sql("SELECT name, stars, review_count FROM yelpBusinessesView这是一个基本的SQL调用，就像它可以获得的IMO一样基本。下面是我得到的错误： Exception in thread "main" org.apache.spa

浏览 25提问于2019-10-18得票数 0

回答已采纳

1回答

在数据库中从UDF内部查询三角洲湖

apache-spark、user-defined-functions、databricks、spark-structured-streaming、delta-lake

需要在结构化流中对UDF中的表执行一些查询。问题是，在UDF内部，如果我尝试使用spark.sql，就会得到空指针异常。这里最好的方法是什么。基本上，我需要从一个表中流，然后使用这些数据从另一个表执行一些范围查询。val query = "select count(*) from appleMart where appleId='"+appleId+"'" val appleCount = spark.sql

浏览 3提问于2020-07-29得票数 2

1回答

如何执行SQL文件中定义的多个SQL查询

java、apache-spark

我有一个包含许多SQL查询的SQL文件，如下所示： CREATE TABLE ..... ; ALTER TABLE .... ; 我想在单个spark.sql调用中执行这些查询，如何在JAVA中实现这一点

浏览 21提问于2021-03-26得票数 1

回答已采纳

1回答

无法查看通过Spark SQL创建的新数据

java、apache-spark、hive、apache-spark-sql

我正面临一个问题，在这个问题中，我无法查看来自Hive的某些数据。重现问题的步骤。Date.valueOf("2016-09-30")), spark.sql(s"ALTER TABLE hive_parquet_nulls_test ADD COLUMNS

浏览 30提问于2019-12-21得票数 3

回答已采纳

2回答

在查询中执行.show()时出错

python、apache-spark、hive、pyspark

我用docker创建了一个Hive容器，我创建了poke表，当我执行Select (一个after ()函数)时出现了这个错误。守则：from pyspark.sql import SparkSession, HiveContext .builder \

浏览 1提问于2018-04-25得票数 0

2回答

Databricks中的错误:您似乎试图从广播变量、操作或转换引用SparkContext

pyspark、azure-databricks、multiprocess

from multiprocess import Poolsql_scripts = ["select * from t1","select * from t2"] spark.sql(sql_script)p.map(transform,sql_scripts)It显示您试图从广播变量有关更多信息，请参阅SPARK-5063 我希望

浏览 10提问于2022-06-05得票数 0

1回答

Spark SQL嵌套JSON错误“在输入时没有可行的替代方案”

apache-spark、apache-spark-sql

Spark SQL嵌套JSON错误： { "yyyData":{ "additionalData当从表中读取数量(“select cast (xxxDetails.yyyData.yyy.additionalData.quantity as Long) as quantity”)时，它将正常工作，但: spark.sqlxxxDetails.yyyData.130.additio

浏览 19提问于2019-06-02得票数 0

1回答

为什么要在笔记本的开头使用SparkSession

apache-spark、pyspark、apache-spark-sql、databricks

我对火花很陌生，我的问题可能是个荒谬的问题。我们可以使用spark.createDataFrame(data)创建数据框架，并且可以使用spark.sql('select 1')执行SQL命令，甚至无需调用SparkSession.builder.appName

浏览 0提问于2022-08-15得票数 1

回答已采纳

1回答

使用无类型转换的空列写入时出错后，覆盖/删除Azure Databricks中的增量表

pyspark、apache-spark-sql、azure-databricks、delta-lake

funcs.lit(None)) 使用以下函数 def write_to_delta_table(df, fnm, tnm, path): spark.sql).write.format('delta').mode('overwrite').option('overwriteSchema', 'true').save(f'{path}/{fnm}') spark.sql(f

浏览 24提问于2021-10-23得票数 1

回答已采纳

1回答

星星之火-sql插入覆盖附加数据，而不是覆盖。

apache-spark-sql

使用外部表 2018-08-29 13:52:00警告TrashPolicyDefault:141代码样本spark.sql("CREATE EXTERNAL TABLE table_1 (id string, name string) PARTITIONED BY (key1 int)stored as parquet location 'hdfs://nameservice1&

浏览 1提问于2018-08-29得票数 3

4回答

如何在Spark中缓存WITH子句中的子查询结果

apache-spark、apache-spark-sql

我想知道Spark是否支持WITH子句中定义的查询的缓存结果。Spark查询如下所示：(WHERE )虽然此查询使用Spark，但我注意到UDF多次应用于相同的数据集。在这个用例中，UDF非常昂贵。因此，我想缓存base_view的查询结果，以便后续的查询能够从缓存的结果中获益。我知道您可以使用给定的查询创建和缓存表，然后

浏览 0提问于2019-02-17得票数 3

回答已采纳

3回答

如何在Spark1.3中通过Hive指示SparkSQL中的数据库

database、apache-spark、hive、apache-spark-sql

代码如下所示：val mySql = "select PRODUCT_CODE, DATA_UNIT from account"val rdd = hc.sql(mySql).rdd 我使用的Spark版本是1.3。问题是hive.execution.engine的默认设置是'mr‘，这使得配置单元使用MapReduce很慢。不幸的是，我不能强迫它使用"spark“。通过

浏览 7提问于2016-06-22得票数 5

1回答

星星之火SQL并使用现有的hive udfs

apache-spark、hadoop、hive、apache-spark-sql、hiveql

我必须阅读spark中现有的hive，所以在spark.sql中我创建了临时函数并使用它，它在火花外壳中工作得很好，但是在火花-提交错误时失败了：代码示例： spar

浏览 0提问于2019-07-14得票数 2

1回答

用蜂箱和火花呢

apache-spark、pyspark、hive、hive-udf

问题在于如何在py火花代码中使用hive jar。我们正在遵循以下一组标准步骤spark.sql("create temporary function public_upper_case_udfas 'com.hive.udf.PrivateUpperCase' using JAR 'gs://hivebqjarbucket/UpperCase.jar'") 调用<

浏览 25提问于2022-05-25得票数 0

1回答

在Spark上执行多个SQL查询

scala、apache-spark、apache-spark-sql

("test.sql").mkString如果出现以下错误，这将失败- org.apache.spark.sql.catalyst.parser.ParseException, 'UNION', 'EXCEPT', 'MINUS', 'INTERSECT', 'SORT', 'CLUSTER', 'DISTRIBUTE'}(

浏览 0提问于2018-03-10得票数 0

回答已采纳

2回答

直接查询文件与读取文件后查询数据帧

scala、apache-spark、apache-spark-sql、parquet

方法1:以下列方式直接查询拼花文件：df.select(columns)方法3:将临时视图查询为：val sqlDF = spark.sql("SELECT columns FROM sample") 在场景的背后，所有的三个基本上都是以相同的方式执行<

浏览 1提问于2018-09-27得票数 1

回答已采纳

2回答

在Spark上调用createOrReplaceTempView时是否会影响性能？

apache-spark、dataset

在我的代码中，我们使用了大量的createOrReplaceTempView，以便能够在生成的视图上调用SQL。这是在转换的多个阶段完成的。它还帮助我们将代码保存在每个执行特定操作的模块中。下面是一个示例代码，用于在上下文中说明我的问题如下。所以我的问题是：当我从每个转换创建多个时，这会增加内存大小吗？，这些视图的生命周期是什么，是否有函数调用来删除它们？true).csv("/apps/cortex&

浏览 8提问于2020-07-01得票数 0

回答已采纳

1回答

如何将Spark.SQL输出的单个值输出保存为变量，以便在代码中进一步使用

python、pyspark、snowflake-cloud-data-platform

value = spark.read.format("net.snowflake.spark.snowflake").options(**sfOptions).option("query", SQL).

浏览 2提问于2022-08-11得票数 2

2回答

AzureException错误: hadoop_azure_shaded.com.microsoft.azure.storage.StorageException:服务器无法验证请求: AzureException

python、sql、azure、apache-spark

我正在尝试执行这个命令，在很多情况下，它都会返回这个错误。spark.sql("""drop table if exists """ + L2_STAGE + """.STERLING_INCREMENT_STAGE_DELTA""") dbutils.fs.rm("dbfs:/mnt/data/governed/l2/stage/order/dtc_merge

浏览 7提问于2021-06-05得票数 1

1回答

AnalysisException:需要结构类型但有字符串

apache-spark、pyspark、struct、databricks、apache-sedona

Long""" )我收到错误了我尝试将"col1“转换为字符串，但无法解决此异常

浏览 6提问于2022-10-17得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云