腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
拼花模式管理
、
、
、
我最近开始了一个新的项目,在那里我们使用火花来以Parquet格式写/读
数据
。该项目正在迅速变化,这里和那里,我们确实需要定期改变拼花文件的模式。目前,我正在与版本控制
数据
和代码进行斗争。我们使用版本控制系统作为代码库,但是很难(至少在我看来)对
数据
本身这样做。我还提供了迁移脚本,用于将
数据
从旧模式迁移到新模式,但在运行迁移之前,我会松散了解parquet文件的模式。
浏览 0
提问于2018-10-19
得票数 3
1
回答
如何使用用户分配的标识从
数据
库访问ADLS容器
、
、
、
我已经成功地在Databricks中挂载了带有服务主体的ADLS,并且能够对
数据
进行必要的转换。 现在,我正在使用用户分配的托管身份来避免在代码中保留秘密。
浏览 6
提问于2022-03-08
得票数 0
1
回答
如果datamart是
数据
仓库的逻辑分区,那么它在datalake中对应的是什么?
、
、
如果datamart是
数据
仓库的逻辑分区,那么它在datalake中对应的是什么?另外,在datalake中是否有类似星形或雪花模式的设计?
浏览 0
提问于2018-04-02
得票数 0
1
回答
外部表的用例?
、
、
、
在雪花里遇到了。您能分享一些使用外部表的用例或好处吗?
浏览 23
提问于2019-11-05
得票数 0
回答已采纳
1
回答
记录
数据
存储Gen2中的文件访问和ACL更改
、
、
有什么方法可以查看Azure DatalakeGen2
日志
中的Acl更改吗?资源的诊断设置已经打开。但我无法看到任何由我或其他人所做的更改的条目。
浏览 1
提问于2021-10-26
得票数 0
回答已采纳
2
回答
天蓝色水滴存储与天蓝色
数据
湖
存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝
数据
湖
存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝
数据
湖
存储更适合,反之亦然? 谢谢。
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
1
回答
如何将我的
日志
文件(在我的EC2实例中生成)注入到azure
数据
云中
、
、
、
、
我正在尝试将在Ec2实例(API Logs)中生成的
日志
文件摄取到Azure云中。我需要在azure中选择哪个服务?请帮我找出这个问题的解决方案。
浏览 0
提问于2021-03-20
得票数 0
1
回答
数据
湖
如何存储
数据
和格式?
、
、
、
、
我听说
数据
湖
可以存储任何类型的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL格式或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
1
回答
永远保留Delta Lake的Delta log事务
数据
、
、
我对德尔塔
湖
的交易记录有点疑惑。文档中提到,默认保留策略为30天,可以通过属性-:delta.logRetentionDuration=interval-string进行修改。但我不明白何时会从delta_log文件夹中删除实际的
日志
文件。是不是我们运行某个操作时发生的?或者可以是真空操作。但是提到,真空操作只会删除
数据
文件,不会删除
日志
。但是它会删除超过指定
日志
保留时间的
日志
吗? 参考-:
浏览 2
提问于2020-12-29
得票数 1
1
回答
Azure
日志
分析和
数据
湖
存储诊断
日志
-筛选出
数据
备份
日志
事件
、
、
我们已经配置Azure Data诊断
日志
,以将
数据
推送到logs。这些
数据
稍后将用于审核目的。我们遇到的问题-我们的每晚备份过程(从一个
数据
湖
存储备份
数据
到另一个
数据
湖
存储)产生千兆字节的几乎无用的
日志
记录。我们可以过滤掉这些
日志
后,他们上传到
日志
分析(在查询中),但这些
数据
需要空间,它需要很多钱。 在将某些
日志
上传到logs之前,是否有一种过滤掉这些
日志
浏览 0
提问于2018-05-25
得票数 1
回答已采纳
1
回答
Delta Gen2和ADLS Gen2事务
、
、
、
、
我们在ADLS Gen2上运行一个Delta
湖
,有大量的表和火花作业。这个设置已经稳定了几个月,但上周,我们看到存储帐户内的事务突然增加,特别是在ListFilesystemDir操作中:我们增加了一些较小的作业,在这个时间框架内读取和写入一些
数据
,但是关闭它们并没有将事务数量减少到原来的水平
浏览 4
提问于2021-05-12
得票数 3
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和
数据
<
浏览 8
提问于2016-03-14
得票数 16
3
回答
AWS
湖
形成: s3://abc/的
湖
形成许可不足
、
、
我正在尝试从AWS
湖
编队控制台设置一个
数据
集。我按照下面的资源进行同样的操作:对s3的
湖
形成许可不足: 有人能帮上忙吗
浏览 0
提问于2020-09-15
得票数 10
1
回答
内部部署的delta
、
我正在尝试在本地实现一个增量
湖
,以分析一些
日志
文件和
数据
库表。我现在的机器上装了ubuntu,apache spark。不确定还需要哪些其他工具。 是否有任何其他工具建议来实施内部
数据
湖
概念?
浏览 20
提问于2021-02-10
得票数 2
1
回答
如何在三角洲
湖
进行createOrReplaceTempView?
、
我想使用我的天蓝色
数据
湖
Gen2上的蜂巢Metastore中的达美
湖
表作为我公司
湖
房的基础。 以前,我使用了“常规”蜂巢目录表。我会将
数据
从拼图加载到火花
数据
,并使用df.CreateOrReplaceTempView("TableName")创建一个临时表,这样我就可以使用spark或% SQL魔术来执行ETL了。但是,如果我不想执行这个saveAsTable操作并写入我的
数据
湖
,该怎么办?使用SQL执行ETL的最佳方法是什么?是
浏览 6
提问于2022-09-08
得票数 0
回答已采纳
1
回答
如何在
数据
工厂级别检查重复文件
、
我正在尝试将文件从一个存储复制到另一个存储,在此之前,我需要进行一些文件验证, 你能帮我如何在
数据
工厂中实现吗?
浏览 3
提问于2022-02-21
得票数 0
2
回答
数据
仓库能包括一个
数据
湖
吗?
、
、
我想更详细地了解
数据
仓库和
数据
湖
。 可伸缩的存储存储库,保存大量原生格式的原始
数据
(“原样”),直到需要时再加上可以在不损害
数
浏览 0
提问于2018-12-11
得票数 1
1
回答
如何从databricks笔记本中捕获
日志
并将其存储到
数据
湖
gen2
、
、
、
、
如何从Databricks笔记本代码中捕获
日志
并将其存储到Azure
数据
湖
gen 2中的文件中? 我希望用Scala语言为我的代码实现自定义
日志
。
浏览 3
提问于2022-01-21
得票数 1
1
回答
如何提高从cosmosdb复制
数据
的性能?
、
、
、
我现在正试图通过
数据
工厂将
数据
从cosmosdb复制到
数据
湖
存储。cosmos迁移工具不工作,没有导出
数据
,也没有问题
日志
。
浏览 3
提问于2017-07-11
得票数 1
2
回答
数据
仓库:如何查询每日快照?
、
我有一些不是时间序列的
数据
库快照。每个快照都很大,250 of,我希望能够将这些
数据
集与其他外部
数据
进行比较(我不知道这些
数据
集的方案)。搜索的一个例子可能是“有多少篇文章是关于短视的?”因此,它必
浏览 0
提问于2016-01-28
得票数 9
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券