腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2433)
视频
沙龙
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和
数据
<
浏览 8
提问于2016-03-14
得票数 16
2
回答
从一个DataLake到另一个DataLake的Azure
数据
工厂复制
、
我需要建立一个能够从一个DataLake复制到另一个的管道,但是到目前为止,通过谷歌搜索,我找不到任何与之相关的东西,有人能给我指出正确的方向吗?非常感谢。
浏览 16
提问于2018-02-21
得票数 0
1
回答
如何使用用户分配的标识从
数据
库访问ADLS容器
、
、
、
我已经成功地在Databricks中挂载了带有服务主体的ADLS,并且能够对
数据
进行必要的转换。 现在,我正在使用用户分配的托管身份来避免在代码中保留秘密。
浏览 6
提问于2022-03-08
得票数 0
2
回答
如果我删除Azure
数据
湖
分析帐户,它会删除它的默认
数据
源吗?
、
我对Azure相当陌生,我只是尝试Azure
数据
湖
分析。为了测试目的,我创建了一个新的Azure帐户,并且希望现在就删除它,但是在安装过程中,我使用了一个现有的Azure
数据
湖
存储(ADLS)帐户作为默认的存储帐户。我现在知道我可能应该添加现有的ADLS作为关联的
数据
存储。
浏览 3
提问于2017-08-18
得票数 0
1
回答
将Azure应用程序Insight日志文件导出到Azure
数据
湖
存储
、
、
我可以通过azure应用程序洞察力跟踪我的应用程序日志文件,并导出xls工作表( ),但是为了备份跟踪目的,我需要将所有日志文件存储到蔚蓝
数据
湖
存储中。我需要在我的应用程序上调试这个问题,当我面对issues.but时,我得到了和继续导出sql,blob存储的链接,我不想要不必要的存储来将我的
数据
存储在蔚蓝资源中。因此,如果有任何方式连接应用程序洞察力到Azure
数据
湖
通过连接器或plugins.IF,its,请您分享我的链接。 谢谢。。
浏览 2
提问于2017-05-30
得票数 5
1
回答
数据
湖
如何存储
数据
和格式?
、
、
、
、
我听说
数据
湖
可以存储任何类型的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL格式或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
1
回答
数据
存档与
数据
摄入
、
从大
数据
或
数据
湖
的角度来看,
数据
归档和
数据
摄入到底有什么区别?我推测,在
数据
湖
的上下文中,“摄入”是一个恰当的词,但是如果我们在那里使用'Archival‘而不是’摄入‘,那么我们所缺少的是什么。我认为使用“摄入”而不是“归档”的几个原因是 谢谢
浏览 1
提问于2018-09-28
得票数 0
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新的
数据
湖
。
数据
以ORC的形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
2
回答
如何处理
数据
湖
vs
数据
仓库中的历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能的(甚至是核心功能)。随着时间的推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
1
回答
Kappa体系结构是否使用
数据
湖
?
、
、
、
、
Kukreja在“Apache、Delta
湖
和Lakehouse的
数据
工程”中说,Kappa体系结构没有
数据
湖
。微软在 (见图)中提到了一家“长期商店”,但没有透露它的实际情况。它使用这些
数据
来“重新计算”。对我来说,这是一个
数据
湖
。
浏览 10
提问于2022-07-21
得票数 0
回答已采纳
1
回答
如果我通过enduser/承租者分割我的微服务
数据
,并且每个服务器都拥有全部
数据
的一个子集,那么如何在所有服务器上查询
数据
呢?
、
、
设想一个高度可伸缩的体系结构,其中每个租户都是按区域和可用性区域划分和分布的,每个服务器都持有总
数据
的一个子集。还存在冗余,还有承载相同逻辑碎片的物理碎片。这很好,如果客户端知道分配给用户的所有逻辑碎片,那么在处理返回极端数量
数据
的请求时,客户端可以使用map/reduce样式检索所有
数据
。这解决了当用户的
数据
量大于任何单个服务器的存储、内存或计算的容量时的问题。那么我的问题是,如果一个名词微服务的
数据
是跨多个服务器隔离和共享的,并且每个服务器都承载着不同的用户或租户子集,我如何创建系统中所有对
浏览 4
提问于2022-07-23
得票数 0
1
回答
能否在Azure database中创建链接服务到Synapse
数据
库
、
嗨,有人能让我知道是否有可能在Azure
数据
工厂中创建链接到湖泊
数据
库的服务吗?
浏览 2
提问于2022-06-20
得票数 0
回答已采纳
1
回答
是否跟踪
数据
池中
数据
的更改?
、
、
最近我发现了
数据
湖
世界,我计划用ADL建立一个
数据
湖
。我不确定的一件事是
数据
湖
应该如何跟踪随时间变化/处理与源不同版本的更改。我遇到过这样的站点,声称
数据
湖
按原样提供
数据
,其他状态是
数据
应该是时间戳,或者文件夹结构应该反映时间戳。干杯!
浏览 0
提问于2019-07-24
得票数 0
回答已采纳
1
回答
如何从Azure
数据
湖
转换,将
数据
按日期文件夹分区到delta
湖
、
、
、
我拥有一个由datetime嵌套文件夹划分
数据
的蔚蓝
数据
湖
gen2。我想向我的团队提供增量
湖
格式,但是我不确定我是否应该创建一个新的存储帐户,将
数据
复制成增量格式,或者将当前的蔚蓝
数据
湖
转换为增量
湖
格式是否是最佳实践。 有人能提供关于这件事的任何建议吗?
浏览 2
提问于2022-08-09
得票数 0
回答已采纳
2
回答
如何使用
数据
工厂截断Dynamics 365实体(并复制到Azure
数据
湖
)?
、
、
、
、
我目前正在使用
数据
工厂将实体从Dynamics 365批量复制到Azure
数据
湖
。实体每24小时保存为
数据
湖
中的CSV文件。我希望将实体截断为新
数据
,并附加到
数据
湖
中已经存在的文件中,而不是批量复制。 我认为这是SQL
数据
库的常见操作,但这可以在Dynamics 365和
数据
湖
之间完成吗?
浏览 14
提问于2019-05-01
得票数 1
2
回答
关于三角洲
湖
的困惑
据我所知,它为您的
数据
存储增加了ACID事务,并通过增量引擎提高了查询性能。如果是这样,为什么我们还需要其他不支持ACID事务的
数据
湖
呢?Delta lakes声称将
数据
湖
和
数据
仓库这两个世界结合在一起,我们知道,由于它目前对操作的支持,它还不能取代传统的
数据
仓库。但它应该取代
数据
湖
吗?为什么需要两份
数据
副本-一份在
数据
湖
中,另一份在德尔塔
湖
中?
浏览 21
提问于2020-07-30
得票数 0
回答已采纳
2
回答
数据
湖
中的
数据
保留策略
我是这个Azure
数据
湖
世界的新手。我正在寻找任何必要的先决条件和注意事项,以便使用蔚蓝
数据
湖
.我找到了一个很好的链接,并发现安静有用。因此,在任何
数据
湖
中,对于
数据
保留策略(归档、清除),我们是否需要遵循特定和基本的考虑?
浏览 1
提问于2017-02-19
得票数 2
回答已采纳
2
回答
在我的用例中需要
数据
吗?
我的web应用程序存储使用
数据
,例如:执行的任务等等,我需要显示仪表板和报告的使用和性能趋势,例如:平均任务执行时间是多少?
数据
来自具有特定
数据
模型的关系
数据
库。 有人要求我创建一个
数据
记录,只是给他我所有的原始
数据
。我不明白这张照片里有什么
数据
。没有模型和关系,我的
数据
是无用的。而且,我没有事件流:我在关系
数据
库中有表。例如,“任务”表中的一行将有“打开时间”列和
浏览 0
提问于2018-11-04
得票数 1
1
回答
Azure
数据
工厂和
数据
库之间的连接
、
、
、
我想知道从Azure
数据
工厂访问databricks最合适的方式是什么。 目前,我已经将databricks作为一个链接服务,我通过一个生成的令牌来访问它。
浏览 0
提问于2019-11-01
得票数 0
2
回答
使用
数据
湖
分析复制
数据
- U-SQL
、
、
我需要从ADLS(Azure
数据
湖
存储)源复制到接收器ADLS,但只复制最新的文件。每小时,到达源的一个.csv文件,这个文件必须被复制到宿
数据
湖
。任务:复制file_01.csv以接收
数据
湖
。event: Hour2 - file_02.csv到达源。任务:复制file_02.csv以接收
数据
湖
。诸若此类。选择最新的文件,并将该文件复制到接收器
数据
湖
中。如何使用u-sql声明包含日期和时间的变量?如何使用u-sql
浏览 2
提问于2018-04-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
湖仓一体架构解析,湖仓一体有哪些优点?
大数据湖仓一体技术白皮书
湖仓一体架构解析
Apache DolphinScheduler 助力 Trino 快速实现湖仓一体数据建设
数据中台与湖仓一体能碰出怎样的火花?网易数帆实时数据湖Arctic的新探索
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券