delta lake是否受spark2.xx支持_如何在Zeppelin的spark解释器中添加对Delta Lake的支持？_此ArcGIS url是否仍受支持？ - 腾讯云开发者社区

apache-spark、pyspark、apache-spark-sql、delta-lake

所以我尝试使用delta df_concat.write.format("delta").mode("overwrite").save("file") it gives me this error：java.lang.NoClassDefFoundError: org/apache/spark/sql/connector/catalog/TableProvider和deltalake文档说更新到了spark3，所以只想确认我们是否<

浏览 28提问于2020-07-28得票数 2

回答已采纳

1回答

Delta Lake MERGE INTO语句

apache-spark、delta-lake

sessions.sessionId = updates.sessionIdWHEN NOT MATCHED THEN INSERT * " 我正在使用io.delta:delta-core_2.11:0.6.1，我哪里做错了？

浏览 58提问于2020-07-15得票数 0

回答已采纳

2回答

AWS Glue能否抓取Delta* Lake表数据？*

apache-spark、amazon-s3、aws-glue、delta-lake

根据Databricks的article，将delta lake与AWS Glue集成是可能的。然而，我不确定是否有可能在Databricks平台之外也这样做。是不是有人这么做了？另外，是否可以使用Glue爬虫添加与Delta Lake相关的元数据？

浏览 16提问于2019-10-02得票数 8

2回答

如何一次查询三角洲湖表中的所有版本，以跟踪对特定ID所做的更改

apache-spark、apache-spark-sql、delta-lake

我有一个带有salary的employee表，它是使用delta lake管理的所有employee的表。FROM DELTA.`EMPLOYEE`但是，我想知道在delta表的所有版本中对员工所做的所有更改的历史。就像这样, timestamp -- From delta table , vers

浏览 3提问于2020-09-14得票数 3

2回答

使用R创建数据库增量表Merge语句

r、duplicates、databricks、sparklyr、delta-lake

我最近开始研究Databricks，并且一直在尝试找到一种方法来对Delta表执行merge语句，尽管使用的是R(最好是sparklyr)。"logs.uniqueId = newDedupedLogs.uniqueId") \ .execute() 然而，我想知道是否有一种直接的方式来通过

浏览 28提问于2021-11-23得票数 1

2回答

Pyspark: Delta表作为流源，怎么做？

apache-spark、pyspark、databricks、delta-lake

什么是预期的，参考来自以下链接https://docs.databricks.com/delta/delta-streaming.html#delta-table-as-a-stream-sourceEx： spark.readStream.format("delta").table("events") -- As expected, should work fine 问题，我用以下方式尝试了相同的方法： df.write.format(&q

浏览 34提问于2020-06-12得票数 5

回答已采纳

2回答

Azure Data Factory可以从Delta* Lake格式读取数据吗？*

azure-data-factory-2、delta-lake

我们能够通过在ADF中将增量文件源指定为parquet数据集来读取文件。尽管这会读取增量文件，但它最终会读取增量文件中数据的所有版本/快照，而不是专门选取增量数据的最新版本。这里有一个类似的问题-- Is it possible to connect to databricks deltalake tables from adf 但是，我希望从ADLS Gen2位置读取增量文件。感谢任何关于这方面的指导。

浏览 20提问于2020-01-03得票数 1

1回答

从本地Spark作业连接到Azure Data Lake* Gen 2*

java、azure、apache-spark、azure-databricks、delta-lake

FileSystem.java:479) at org.apache.spark.sql.delta.DeltaTableUtils我使用的是io.delta 0.3.0，Spark 2.4.2_2.12和azure-hadoop3.2.0。fs.azure.account.key.stratify.dfs.core.windows.net", "my gen 2 key");

浏览 21提问于2019-09-12得票数 2

2回答

无法读取Delta格式的Delta* / Parquet文件*

apache-spark、pyspark、azure-databricks、delta-lake

我试图使用Databricks中的以下代码来读取Databricks中的delta / parquet df3 = spark.read.format("delta").load('/mnt/lake/

浏览 9提问于2022-08-06得票数 0

回答已采纳

2回答

具有到增量湖的多个相同密钥的流写入

apache-spark、spark-streaming、delta-lake

我正在通过spark structured向delta写入数据流。每个流批次包含key - value (还包含作为一列的时间戳)。delta lake不支持在源(蒸汽批)上使用多个相同的键进行更新，所以我只想用最新的时间戳记录来更新delta lake。我该怎么做呢？

浏览 27提问于2020-06-19得票数 2

回答已采纳

1回答

如何将内联数据集(增量)的参数化链接服务的参数传递到数据流？

dataframe、azure-data-factory、dataflow、delta-lake

我在数据流中有一个增量数据源。为了连接到它，我需要使用参数化的链接服务；但是，我找不到可以为链接的服务参数值寻址的地方：在数据流中，我看不到任何提示来解决我的参数值：谢谢:)

浏览 7提问于2021-10-20得票数 0

1回答

Apache Alluxio可以使用Azure Data Lake作为存储吗？

azure、azure-data-lake、alluxio

我已经使用Spark2.2和HDI3.6创建了一个从HDInsight data Lake读取数据的Azure集群。用户将在它上面执行Spark-SQL，我想使用Alluxio作为缓存来加速查询。经过一些研究，我发现Azure Blob Storage是受支持的：。我想知道Azure Data Lake也支持吗？

浏览 5提问于2018-06-20得票数 0

4回答

没有Databricks运行时的Delta Lake

apache-spark、hdfs、databricks、delta-lake

可以使用Delta Lake而不依赖于Databricks Runtime吗？(我的意思是，是否可以仅在prem上使用带有hdfs和spark的delta-lake？)

浏览 10提问于2020-03-24得票数 5

1回答

寻找用于AVRO .avdl文件的ERD (Viz)工具

visualization、avro、erd

有没有人推荐一个接受.avdl文件的ER可视化程序。我需要它在本地接受avdl文件而不是json格式。我看过一些(Hackolade，Dataedo)，但它们似乎都只接受.json文件。如果有人有什么建议，我们将不胜感激。谢谢

浏览 6提问于2021-09-21得票数 0

1回答

Azure Data Factory是否可以摄取存储在Azure Data Lake* Store中的XML文件？*

xml、azure、dataset、azure-data-lake

有什么方法可以从Azure Data Lake Store Gen1中摄取XML文件吗？我正在尝试使用Azure Data Lake Store Gen1在Azure数据工厂中创建DataSet。但是，XML似乎不是一种受支持的文件格式--仅支持分隔文件等。我已将XML文件导入到Azure Data Lake Store内的文件夹结构中。我必须选择Azure Data Lake Store Gen1来在文件夹结构中选择我的文件，它做得很好。但是，没有XML格式选项-只

浏览 2提问于2019-07-19得票数 0

1回答

Azure权限支持ADF数据流中的增量格式接收器

azure、azure-data-factory、azure-databricks、azure-purview

然而，当我们在ADF (一种数据流的内联格式)中使用dataflow接收Delta格式的数据时，它似乎没有捕获谱系信息。然而，它捕获了使用“拼图”格式的“数据集”下沉时的谱系信息。

浏览 31提问于2020-12-10得票数 1

回答已采纳

2回答

关于三角洲湖的困惑

delta-lake

我试着阅读了很多关于databricks delta lake的资料。据我所知，它为您的数据存储增加了ACID事务，并通过增量引擎提高了查询性能。如果是这样，为什么我们还需要其他不支持ACID事务的数据湖呢？Delta lakes声称将数据湖和数据仓库这两个世界结合在一起，我们知道，由于它目前对操作的支持，它还不能取代传统的数据仓库。

浏览 21提问于2020-07-30得票数 0

回答已采纳

1回答

使用Kubernetes设置Delta Lake

apache-spark、delta-lake

是否有任何在线链接或文档可以作为设置Delta Lake (没有Databricks Runtime)与Kubernetes一起使用的指南？

浏览 4提问于2021-11-16得票数 0

2回答

Databricks:将镶木镶嵌表转换为增量表

apache-spark-sql、databricks、azure-databricks、delta-lake

我正在尝试将Databricks (Azure上的存储)中的现有表转换为Delta。根据提供的信息，这非常简单，我编写了两个sql语句来实现这一点：convert to delta parquet.为了验证，我对表中的一些记录运行了delete操作，这给出了错误： A transaction log for Databricks Delta was found at `dbfs:/path/to/storage/

浏览 2提问于2020-07-15得票数 2

2回答

如何将Azure数据湖中的数据推送到SSAS ( Azure分析服务)？有可能吗？

azure-data-lake、azure-analysis-services

Azure数据湖是我的数据源。我想将数据从azure数据湖推送到Azure分析服务(SSAS)。我怎么能做到这一点？

浏览 1提问于2016-12-02得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云