腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5009)
视频
沙龙
1
回答
Databricks
增量
文件
添加
新
分区
导致
旧
分区
不
可读
、
、
、
我的
增量
文件
被calendar_date
分区
file dosen't exist spark.read.format("delta").load(&quo
浏览 32
提问于2021-03-06
得票数 1
回答已采纳
1
回答
Databricks
-如何更改现有
增量
表的
分区
?
、
我在
Databricks
增量
中有一个表,它由transaction_date
分区
。我想将
分区
列更改为view_date。我尝试删除该表,然后使用PARTITIONED BY (view_date)使用
新
的
分区
列创建它。 然而,我的尝试失败了,因为实际的
文件
驻留在S3中,即使我删除了一个hive表,
分区
也保持不变。有没有办法改变现有
增量
表的
分区
?或者,唯一的解决方案是删除实际数据,并使用
新
指定的<em
浏览 27
提问于2019-03-05
得票数 10
回答已采纳
2
回答
从蔚蓝数据库中的多任务作业编写
分区
Delta表时出错
、
、
、
、
执行作业时,将显示以下错误: 更新:I在条件中进行了调
浏览 7
提问于2022-02-11
得票数 0
回答已采纳
1
回答
用Delta格式覆盖火花数据写入方法中的特定
分区
、
、
、
当使用Parquet格式时,能够通过下面的设置覆盖特定的
分区
,而不会影响其他
分区
文件
夹中的数据 spark.conf.set("spark.sql.sources.partitionOverwriteModewrite.mode("overwrite").format("parquet").partitionBy("date", "name").save("abfss://path/to/somewhe
浏览 9
提问于2022-07-14
得票数 0
1
回答
Spark Job将数据帧写入已
分区
的
增量
表
、
、
、
、
运行
databricks
以读取csv
文件
,然后另存为
分区
增量
表。
文件
中的总记录为179619219条。它被划分为A列(8419个唯一值)、年份( 10年)和月份。
浏览 4
提问于2021-11-10
得票数 1
1
回答
星火三角洲湖泊合并
分区
修剪
、
s.eventtime < t.eventtime").updateAll() .execute()
增量
表是按类别划分的如果我在('a1',‘a2’)中
添加
‘和a2’这样的
分区
过滤器,我可以从火花图中看到输入不是整个表。我想它确实是在修剪隔墙。我希望它能够自动感觉到它应该使用哪些
分区
来执行连接,类似于向下推。这是否可以在
不
指定特定
分区
值
浏览 1
提问于2019-11-13
得票数 4
1
回答
Databricks
-如何确定
分区
数量?
、
、
我正在处理一个
文件
,在保存为
增量
之前,我运行了一个repartition(48, key)。在初始运行时,它在
增量
中生成大约25个
分区
(没有问题,因为键可能
导致
数据落入25个
分区
-我假设它不一定为没有数据的节点创建
分区
?)。但是,在第二次运行时(通过合并完成),生成了60+
分区
文件
(这是一个具有1700个预先存在的键和仅300个
新
键的SCD进程) 我的理解是,repartition使用散列算法来确定键属于哪个
浏览 30
提问于2020-09-23
得票数 2
1
回答
在新
文件
中插入结果
、
我每小时填充一次该表,但我按月对该表进行
分区
(数据集相对较小)。每小时我都想将
新
数据插入到一些
分区
中。有没有办法让HIVE将数据附加到
分区
中的
旧
文件
中(而不对
旧
数据使用UNION ALL )?
浏览 1
提问于2012-08-22
得票数 3
回答已采纳
1
回答
复制到:如何
添加
分区
?
、
、
Databricks
中的命令COPY INTO提供了一个摄取
增量
表的幂等
文件
,请参阅here。在文档中,示例命令如下所示: COPY INTO delta.FILEFORMAT = CSV FORMAT_OPTIONS('header' = 'true') 但是,我希望通过
分区
来摄取数据是否可以使用
分区
执行COPY INTO命令?简单地
添加
p
浏览 12
提问于2021-06-16
得票数 1
1
回答
如何删除以前主要安装的现有
分区
?
、
、
这个星期早些时候,我的安装出现了一个严重的问题,这个问题变得越来越糟,
导致
我在同一个驱动器上重新安装13.10次,但被分割成了两部分。我刚刚完成了从
旧
分区
复制所有重要
文件
的工作,
新
分区
上的一切工作都很顺利,所以现在我希望将新主
分区
的大小调整到完全大小,并将整个旧
分区
吹走。如果
不
确保
不
丢失任何数据,并确保
新
的主
分区
与GRUB引导加载程序保持正确关联,我就不完全确定如何做到这一点,因为
浏览 0
提问于2014-01-09
得票数 0
1
回答
如何更新Cosmos DB文档
分区
键元素?
、
我需要更新一个文档,更改用作
分区
键的元素的值。文档说,文档是由id和
分区
键唯一标识的。 如果
不
总是创建新文档,那么如何确定创建新文档的情况,以便删除
旧
文档?我不想删除任何东西而
不
首先创建
新
的,因为没有事务性的方法来做
浏览 0
提问于2019-01-26
得票数 4
回答已采纳
1
回答
如何让Kafka用户订阅
新
分区
、
我有几个Kafka用户订阅了一个主题,需要
添加
一些
分区
。我在临时环境中使用,并
添加
了一些
新
分区
。我对Kafka的理解是,它们应该自动重新平衡,并订阅
新
的
分区
。除非他们
不
这样做,重启也没有用。每次我这样做(现在已经两次了),一夜之间消费者就会订阅
新
分区
。 如果我在控制台中创建一个
新
的测试组,它可以订阅
新
的
分区
。但在控制台中使用现有的组id进行订阅时,会重新平衡工作进
浏览 23
提问于2019-07-05
得票数 2
回答已采纳
1
回答
那么
增量
金属加载呢?
、
、
、
就我而言,Hadoop中不支持
增量
加载。我在玩小猪和蜂巢。出于测试目的,我只是从中的表中读取现有值,将其与
新
数据合并,然后在中创建
新
表,插入数据。删除
旧
的表,重命名
新
的表,等等。其他解决方案是将
新
数据
添加
到现有表中的
分区
。问候 帕韦尔
浏览 1
提问于2014-02-13
得票数 0
1
回答
如何镜像具有两个
分区
的ftp服务器目录,其中一个几乎已满?
、
、
、
、
分区
中的存储库几乎已经满了。它是带有ftp服务器的wget -m(镜像)。现在它已经满了我的本地存储库,我必须开始使用另一个
分区
。它是wget -m,因为除了每天在ftp服务器中
添加
新
目录之外,
旧
目录中不时会有更改。 我需要将ftp服务器与
旧
分区
“同步”,并将新
文件
复制到
新
分区
。无法在ftp服务器上删除或进行更改。我读过-m相当于-r -N -l和-N
不
兼容-O(--output-document)
浏览 2
提问于2022-10-04
得票数 0
1
回答
使用HBase代替配置单元
、
、
我们有这样一种情况,表模式是
不
固定的,它可能会改变例如:可以
添加
新
列(在模式中的任何位置,不一定在末尾)、删除和重命名。在Hive中,一旦创建了
分区
,我想它们就不能被更改了,也就是说,我们不能在
旧
分区
中
添加
新
的列,而只用数据填充该列。我们必须用
新
的模式重新创建
分区
,并在所有列中填充数据。但是,
新
分区
可以有
新
的模式,并将包含
新
列的数据(不确定是否可
浏览 6
提问于2017-04-28
得票数 0
1
回答
将FAT32
分区
转换为NTFS而
不
丢失数据
、
、
、
有没有一种方法可以在
不
丢失数据的情况下将
分区
格式从FAT32更改为NTFS?因此,我正在寻找一种不删除数据的解决方案,只需将
分区
格式从FAT32更改为NTFS即可。这样的事情可能吗?
浏览 0
提问于2013-06-02
得票数 4
回答已采纳
2
回答
如何将
分区
添加
到现有的Iceberg表
、
、
、
如何将
分区
添加
到现有的未
分区
的Iceberg表中?表已经装载了数据。
浏览 6
提问于2020-03-11
得票数 3
1
回答
在partition上有两个家庭
分区
,增加家庭
、
、
我的主
分区
有一些空间限制。我的
分区
的配置是:驱动器C窗口删除并格式化为EXt4以
添加
到ubuntu30.26根39.11家庭我能不能把这个
新
释放的驱动器也划分为家呢?我可以同时有两个分开的
分区
作为家吗?或者,我是否可以将交换空间更改为
新
的已释放空间,并展开home (最后一个
分区
到就在它前面的旧交换区)。这样,因为主
分区</em
浏览 0
提问于2017-10-16
得票数 0
1
回答
如何格式化家庭
分区
!
、
、
很多事情都出了问题,我决定在
旧
的Ubuntu使用的
分区
上重新分配Ubuntu。对于这个安装,我创建了四个不同的
分区
:\、\home、\boot和swap,我指示
旧
的ubuntu
分区
为
新
的主
分区
(可能我没有选择格式化它)。我想早期的ubuntu安装仍然存在于\home
分区
中。 是否有可能只格式化主
分区
,同时保持它的结构(或者格式化它并重新安装结构而
不
陷入
新
的混乱)?“主
文件
夹”,其中
浏览 0
提问于2013-03-08
得票数 1
回答已采纳
2
回答
当内核更新完全填充我的引导
分区
时会发生什么?
当我安装12.04时,我
分区
了一个1GB的引导
分区
。每个安装
新
内核的更新都会
添加
到引导
分区
的内容中。很快它就会被填满。Ubuntu是否会自动覆盖或清除引导
分区
中未使用的
旧
文件
?
浏览 0
提问于2013-07-07
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 3.0重磅发布!开发近两年,流、Python、SQL重大更新全面解读
深度对比Delta、Iceberg和Hudi三大开源数据湖方案
Flink on Hive构建流批一体数仓
SQL Server数据库水平分区分表实例
【大数据】Hive 小文件治理和 HDFS 数据平衡讲解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券