腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如
何在
Delta
Lake
表
中
添加
新
列
?
、
、
、
我正在尝试向Azure Blob存储
中
存储为增量表的数据
添加
新
列
。对数据执行的大多数操作都是upsert,有很多更新,很少有
新
的插入。insertAll() .updateExpr(upsertStat) .execute() 从these docs上看,
Delta
Lake
似乎只支持在insertAll()和updateAll()调用
中
添加
新
浏览 63
提问于2020-08-22
得票数 3
回答已采纳
2
回答
AWS Glue能否抓取
Delta
Lake
表
数据?
、
、
、
根据Databricks的article,将
delta
lake
与AWS Glue集成是可能的。然而,我不确定是否有可能在Databricks平台之外也这样做。是不是有人这么做了?另外,是否可以使用Glue爬虫
添加
与
Delta
Lake
相关的元数据?
浏览 16
提问于2019-10-02
得票数 8
1
回答
为
Delta
Lake
中
的
表
创建索引
、
、
我是
Delta
Lake
的新手,但我想为
Delta
Lake
中
的一些
表
创建一些索引,以便快速检索。它表明最接近的是通过创建数据跳过,然后索引跳过的部分:除了跳过数据之外,似乎找不到创建索引的其他方法 如
何在
Delta
Lake
中
像在RDBMS
中
创建
表
一样创建索引
浏览 2
提问于2019-10-24
得票数 2
1
回答
Delta
Lake
MERGE INTO语句
、
sessions.sessionId = updates.sessionIdWHEN NOT MATCHED THEN INSERT * " 我正在使用io.
delta
:
delta
-core_2.11:0.6.1,我哪里做错了?
浏览 58
提问于2020-07-15
得票数 0
回答已采纳
4
回答
没有Databricks运行时的
Delta
Lake
、
、
、
可以使用
Delta
Lake
而不依赖于Databricks Runtime吗?(我的意思是,是否可以仅在prem上使用带有hdfs和spark的
delta
-
lake
?)
浏览 10
提问于2020-03-24
得票数 5
1
回答
基于结构化流媒体作业流水线的
delta
lake
最优分区策略
、
、
在我的场景
中
,我有两个结构化的流作业,一个写到
Delta
lake
表
,第二个作业从
delta
lake
表
读取,处理它并写入另一个
表
。对于结构化流(它只需要挑选在最后一个流批次之后插入的
新
记录),我应该创建的分区的最佳选项是什么。如果我在我的
表
中使用CreatedDateTime
列
,做下一个作业,从这个
表
中
读取将使用那个分区。
浏览 3
提问于2019-09-21
得票数 0
2
回答
使用R创建数据库增量表Merge语句
、
、
、
、
我最近开始研究Databricks,并且一直在尝试找到一种方法来对
Delta
表
执行merge语句,尽管使用的是R(最好是sparklyr)。
浏览 28
提问于2021-11-23
得票数 1
3
回答
德尔塔湖
表
重复数据消除
、
、
我在Azure有一张
Delta
Lake
桌子。我使用的是Databricks。当我们
添加
新
条目时,我们使用merge into来防止重复项进入
表
中
。然而,重复项确实进入了
表
中
。我不知道这是怎么发生的。有什么方法可以检测并删除
表
中
的重复项吗?我找到的所有文档都展示了如
何在
合并之前对数据集进行重复数据删除。这一次什么也没有,副本已经在那里了。如何删除重复项? 谢谢
浏览 1
提问于2020-10-13
得票数 0
1
回答
用SymlinkTextInputFormat查询达美湖
表
、
、
、
、
问题摘要:无法通过S3
表
上的Athena查询数据。我相信,如果帐户启用了
Lake
,问题就会具体发生。 设置一个
新
的雅典娜
表
(更新下面的$bu
浏览 14
提问于2021-12-09
得票数 1
2
回答
在Azure数据库中将Spark数据存储到
delta
表
时丢失数据格式
、
、
、
、
当我试图将Spark作为
delta
表
保存到Azure Databricks
Delta
Lake
时,我的所有数据类型都会变成字符串。此外,过去是datetime类型
列
中
的所有日期都会在没有可识别模式的情况下被洗牌。 有人知道为什么会发生这种情况吗?如何预防?
浏览 6
提问于2022-06-30
得票数 1
1
回答
如
何在
mysql字段数据
表
中
插入
新
列
?
、
如
何在
mysql字段数据
表
中
插入
新
列
?例如,如果我有一个包含myfield
表
field_data_field_myfield的字段(myfield),其中包含以下列‘实体_类型’、‘实体_id’、‘修订_id’、'bundle‘、'
delta
’、‘语言’、'myfield_value‘和’myfield_format‘……我如何将
列
mynew
列
添加
为类型varchar?
浏览 0
提问于2016-04-06
得票数 1
回答已采纳
1
回答
在数据库上的
Delta
上指定列名和推断模式
、
、
我正在使用sql来处理databricks
delta
实时
表
特性。有一个选项可以为它提供一个显式模式,但鉴于这是一个着陆
表
,我希望将这种开销的负担降到最低。星火文档非常稀少,而且databricks文档甚至更糟糕。有人知道我能不能这么做吗?
浏览 4
提问于2022-05-17
得票数 1
1
回答
Delta
Lake
:
Delta
表
的下一版本如何不携带删除的记录?
、
、
、
我们每天在
delta
lake
表
(
表
名: dst1)中加载源文件作为时间序列数据。如果deltalake
表
不存在,我们将创建一个
表
。如果
表
确实存在,我们将合并
新
数据作为时间序列数据。Creating Table if table does not exist: spark.sql(f"CREATE TABLE {dtable} USING
DELTA
LOCATION {dmount1Mapple Syrup F
浏览 20
提问于2021-09-23
得票数 2
回答已采纳
1
回答
如
何在
编写蒸火花数据时指定增量表属性
、
、
、
让我们假设我有一个流数据,并且我将它写到Databricks
Delta
Lake
: .format("
delta
") .start("targetPath")spark.sql("CREATE TABLE <TBL_NAME> USING
DELTA
LOCAT
浏览 11
提问于2021-11-30
得票数 3
回答已采纳
1
回答
(Azure Data Factory)如果
列
不存在,则聚合不起作用
、
、
我正在处理这个数据流:如
何在
还不存在的列上使用聚集?因为数据流从未启动过。 我必须在一个数据流
中
做到这一点(不是一个数据流初始化
Delta
Lake
,另一个数据流插入
新
行)。
浏览 3
提问于2021-10-14
得票数 0
1
回答
如
何在
databricks
中
现有的增量表
中
添加
自动增量
列
、
、
、
在Databricks
中
,我有一个现有的
delta
表
,我希望在其中再
添加
一个
列
,作为Id,这样每一行都有唯一的id no,并且是连续的(主键在sql
中
的存在方式)。到目前为止,我已经尝试将
delta
表
转换为,并将
新
列
添加
为from pyspark.sql import functionswithColumn(&q
浏览 5
提问于2022-07-12
得票数 0
2
回答
根据硬编码值拆分列的SQL查询
、
、
我有一张桌子(
如
假定这个装置)我可以定义硬编码的类别,我不确定如
何在
sql中表示这一点。Categoy1 = "alpha, bravo,
delta
, gamma'
浏览 4
提问于2013-02-05
得票数 0
回答已采纳
1
回答
如
何在
Delta
Lake
中
删除旧版本的
表
、
正如我从文档中了解到的,
delta
允许回滚,或者
如
他们所说的那样,可以回滚到某个特定版本的
表
。但是,我如何确保删除数据会在不创建新版本的情况下将其删除?
浏览 38
提问于2019-10-01
得票数 2
回答已采纳
1
回答
如何将Tableau/BI工具连接到
Delta
Lake
?(没有databricks)
、
、
、
我正在努力弄清楚的一件事是如
何在
spark会议之外连接到
Delta
Lake
(银牌和金牌)
表
。我希望能够使用像Tableau这样的BI工具连接到这些
表
。我没有使用databricks,我想知道将这些
表
存储在hive metastore
中
是否会有所帮助。如果不是这样,那么是否有人可以帮助我与其他方法或如果这是可行的或不可行的。
浏览 61
提问于2021-04-04
得票数 2
3
回答
如
何在
Databricks
中
重命名列
、
如
何在
Databricks
中
重命名列?以下内容不起作用:它返回错误: 如果有差异的话,这个
表
使用的是<em
浏览 6
提问于2019-12-26
得票数 12
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券