Databricks/Spark data write to SQL DW正在删除表并重新创建它

apache-spark、apache-spark-sql、databricks、azure-sqldw、azure-databricks

在Azure SQL DW中，我有一个空表(比如表T1)。假设T1有4列C1、C2、C3和C4 (C4不为null)我在数据库中有一个数据帧(比如df1)，其中包含C1、C2和C3的数据我使用如下代码片段对dataframe执行写操作 df1.write.format("com.databricks.spark.sqldw") .option("dbtable"

浏览 19提问于2019-03-09得票数 0

1回答

将数据写入Azure专用SQL池中的特定分区

apache-spark、azure-sql-database、azure-databricks、azure-synapse、azure-sqldw

目前，我们正在使用下面文章中的步骤从我们的spark数据源(增量湖表)中完全加载数据，并将它们写入到SQL DW上的表中。https://docs.microsoft.com/en-us/azure/databricks/data/data-sources/azure/synapse-analytics具体地说，使用以下命令执行写入， df.<e

浏览 27提问于2021-09-21得票数 0

2回答

将PySpark数据存储在SQL数据库中的Synapse中会出现错误"IllegalArgumentException: KrbException:无法找到默认领域“

python、azure、pyspark、azure-synapse

我试图在Synapse中的SQL数据库中保存一个PySpark数据：test.write\ .option("url", "jdbc:sqlserver://XXXX.sq

浏览 12提问于2022-06-21得票数 1

回答已采纳

1回答

数据库Azure数据库仓库保存表

databricks、azure-sqldw

我使用以下代码编写Azure仓库表df_execution_config_remain.write .option"dbTable", execution_config) .mode("Overwrite") 但是，覆盖将删除表<

浏览 3提问于2019-06-27得票数 1

2回答

如何更改Delta表的添加列？

delta-lake

我想使用spark在Delta表中添加一些列，但它显示的错误如下： ALTER ADD COLUMNS does not support datasource table with type org.apache.spark.sql.delta.sources.DeltaDataSource

浏览 3提问于2022-03-14得票数 3

1回答

如何使用Azure Synapse在数据库中删除表或行？

azure、pyspark、databricks、azure-databricks、azure-synapse

我想使用DROP TABLE删除我的表，但是我在我的Databricks上得到了一个错误JDBC，但是如果我使用SELECT，它不会出现任何错误，我有两个不同的函数可以read_from_synapse) ) return dfdef write_to_synapse(df, table, write_mode, url

浏览 5提问于2021-06-04得票数 1

1回答

如何将Azure Synapse Dataframe转换为JSON on Databricks？

azure、pyspark、databricks、azure-databricks、azure-synapse

因为当我尝试的时候，它得到了一个错误。com.databricks.spark.sqldw") # Commented at 20200121 Sql dw connetion exception (email keyword: Databrickscannot access the DW) .option("table

浏览 19提问于2021-05-31得票数 0

回答已采纳

1回答

小数点(10，0)到十进制(38，18)转换无效的Databricks* Delta表Alter列*

spark-streaming、databricks、azure-databricks、delta-lake

在Databricks中，表是使用模式json定义创建的。([], tbl_schema) # create table.我使用的是Spark结构化流写流，它使用foreachBatch()，UPSERT (合并为)。问题：每当我运行时，表都不会与数据一起插入。也没有调试日志消息。我认为这个问题可能是由于

浏览 0提问于2021-10-17得票数 0

回答已采纳

2回答

从星火看saveAsTable

apache-spark、hive、pyspark

我们试图从SPARK中写入一个蜂箱表，并且使用saveAsTable函数。我想知道saveAsTable是否每次掉落并重新创建蜂巢表？如果它这样做了，那么是否还有其他可能的火花函数实际上只会截断和加载一个表，而不是拖放和重新创建。

浏览 0提问于2018-07-17得票数 2

回答已采纳

6回答

Azure Databricks* -无法创建关联位置已经存在的托管表*

apache-spark、hive、azure-data-lake、databricks、azure-databricks

有时，当我试图将DataFrame保存为托管表时：我得到以下错误：目前，我能想到的唯一解决办法是使用不同的表名。当我跑步时：SELECT * FROM So

浏览 4提问于2019-03-27得票数 23

1回答

数据库中的Delta湖-为现有存储创建一个表

apache-spark、databricks、delta-lake

我目前在databricks中有一个附加表(spark 3，databricks 7.5) .select("somefield", "anotherField",(如上面所示) 现在，我希望能够使用SQL逻辑来查询它，而不必每次都经过createOrReplaceTempView。是否可以在不删除表的情况下将表添加到当前数据中？我需要什么改变来支持这一点？

浏览 2提问于2021-01-10得票数 2

回答已采纳

1回答

用数据库实现火花放电循环的误差

pyspark

我正在尝试执行此代码，它将列出Databricks SQL中已经存在的所有表，如果它不存在，则应该创建该表。但我搞错了，不知道在哪里：tables = spark.sql('show tables') else:

浏览 3提问于2022-05-26得票数 0

1回答

AnalysisException:在删除条件下不支持谓词中的多列

sql、databricks、databricks-sql

我正在我的databricks代码中执行以下操作。代码试图在seam简单的条件下从我的表中删除一些行。yesterday.strftime('%Y/%m/%d') query = f"""DELETE FROM table_name a WHERE AWB_ID IN (SELECT * FROM a WHERE a.DW_CRT_RUN_DT>= '{yesterday_str}' or a.d

浏览 4提问于2022-10-22得票数 0

3回答

如何从Databricks* Delta表中删除列？*

sql、apache-spark、apache-spark-sql、databricks、delta-lake

我最近开始发现Databricks，并面临需要删除增量表的某一列的情况。当我使用PostgreSQL时，它就像DROP COLUMN metric_1; 我正在查看删除时的数据库，但它只覆盖了DELETE the我也找到了关于DROP database，DROP function和DROP table的文档，但完全没有关于如何从增量表中删除列的文档。这里我漏掉了什么？是否有从增量表中删除列的标准方法？

浏览 4提问于2019-01-31得票数 12

回答已采纳

2回答

Spark 2.0 CSV错误

csv、apache-spark、apache-spark-2.0、databricks

我正在从1.6升级到spark 2，在读取CSV文件时遇到问题。在spark 1.6中，我会在CSV文件中读取类似这样的内容。val df = sqlContext.read.format("com.databricks.spark.csv").load(fileName)in thread "main" java.lang.RuntimeException: Multip

浏览 73提问于2017-01-19得票数 0

2回答

数据库上的截断表

apache-spark、pyspark、azure-sql-database、databricks、azure-databricks

我正在使用Azure中的两个环境: Databricks和SQL数据库。我正在处理一个函数，该函数生成一个dataframe，它将用于覆盖存储在SQL数据库中的表。我有很多问题，因为df.write.jdbc(mode = 'overwrite')只删除了表，而且，我猜，我的用户没有再次创建的权限(我已经看到了DML和DDL权限，我需要这样做)。在简历中，我的函数只删除表，而不重

浏览 1提问于2021-03-02得票数 2

回答已采纳

1回答

在追加模式下写入pyspark中的红移

pyspark、amazon-redshift

我正在尝试使用pyspark将一个数据帧追加到redshift表中。我做错了什么？该表已经存在，并且已经包含一些数据。myDf.write \.option("url", JDBC_REDSHIFT) \ .option('forward_spark_s3/python/lib/pyspark.zip

浏览 22提问于2019-01-16得票数 3

1回答

无法使用Databricks将数据插入到分区表中

databricks、azure-databricks

我刚接触Databricks，我正在尝试使用Databricks将数据插入到分区表中，语法如下。但没那么走运。Location STRING,USING csvPARTITIONED BY (CallType) LOCATION '/mnt/Databricks/employee/Fire_Department_Calls_for_Service.csv&

浏览 36提问于2020-08-04得票数 0

回答已采纳

1回答

将配置单元表卸载到。使用Spark或pyspark或python的dat文件

python、pyspark、apache-spark-sql、hiveql

我目前正在使用hql将数据从配置单元表卸载到文本文件中。因为它花费了太多的时间。我想去spark或pyspark.I。我是spark/ please的新手。你能帮我解决这个问题吗?我正在使用下面的查询来卸载 beeline --outputformat=dsv --silent=true - e 'select * from <tablename>' > /dir/samplefile.txt

浏览 11提问于2019-10-04得票数 0

1回答

spark scala数据帧编写器insertInto覆盖

scala、apache-spark、hive、apache-spark-sql

我正在尝试将数据帧的内容写入现有的分区托管Hive表，如下所示：目标表是ORC，我希望保留它使用saveAsTable将删除并重新创建作为parquet的表(请参阅此处：)。问题是对于我的一些表，我需要覆盖整个表数据(类似于截断)，而不仅仅是特定的分区。Spark

浏览 8提问于2021-02-20得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将数据写入Azure专用SQL池中的特定分区

将PySpark数据存储在SQL数据库中的Synapse中会出现错误"IllegalArgumentException: KrbException:无法找到默认领域“

数据库Azure数据库仓库保存表

如何更改Delta表的添加列？

如何使用Azure Synapse在数据库中删除表或行？

如何将Azure Synapse Dataframe转换为JSON on Databricks？

小数点(10，0)到十进制(38，18)转换无效的Databricks* Delta表Alter列*

从星火看saveAsTable

Azure Databricks* -无法创建关联位置已经存在的托管表*

数据库中的Delta湖-为现有存储创建一个表

用数据库实现火花放电循环的误差

AnalysisException:在删除条件下不支持谓词中的多列

如何从Databricks* Delta表中删除列？*

Spark 2.0 CSV错误

数据库上的截断表

在追加模式下写入pyspark中的红移

无法使用Databricks将数据插入到分区表中

将配置单元表卸载到。使用Spark或pyspark或python的dat文件

spark scala数据帧编写器insertInto覆盖

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐