腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(26)
视频
沙龙
4
回答
什么是
数据
湖
?
bigdata
我熟悉“大
数据
”的概念,但“
数据
湖
”与“大
数据
”有何不同?它是从大
数据
衍生出来的吗?请解释一下。
浏览 0
提问于2019-04-24
得票数 1
回答已采纳
1
回答
如何用更新的模式从拼图中获取
数据
amazon-web-services
、
parquet
、
aws-glue
、
amazon-athena
我在S3中使用AWS雅典娜+ AWS Glue + Parquet,当我修改在AWS中声明的模式时,雅典娜不查询新
数据
。例如。
浏览 6
提问于2022-05-27
得票数 0
2
回答
HDFS和ADLS有什么区别?
hadoop
、
hadoop2
、
azure-data-lake
与HDFS不同的是,我对天蓝色
数据
湖
的存储方式感到困惑。有谁能简单地解释一下吗?
浏览 2
提问于2020-07-09
得票数 1
回答已采纳
2
回答
Google 4由于阈值处理而保留
数据
google-analytics
、
analytics
、
google-analytics-4
然而,在数千名访客之后,我们想看一看报告,由于“阈值化”,
数据
被封锁了:学习更多链接带您浏览此页,其中说是什么导致了这种脱粒?
浏览 0
提问于2022-06-06
得票数 6
1
回答
数据
库中的多个单元格
azure-databricks
我是
数据
库新手。问题是为什么笔记本中有多个单元格,当我们可以在一个单元格中编写完整的指令/程序时? 致以敬意,
浏览 2
提问于2022-04-10
得票数 0
1
回答
从RDS (需要从所有模式同步4个表)到S3 ()的AWS Glue同步
数据
amazon-s3
、
amazon-rds
、
aws-glue
、
data-lake
、
aws-datasync
现在,我们的几个模式(大约5到10个模式)包含几个大表(大约5到7个
大
表,每个大表包含10到2亿行)。对于UI,我们需要显示一些静态和图表,并计算静态和图形
数据
,我们需要在
大
表上执行联接,这会减慢整个
数据
库服务器的运行速度。有时,我们需要在夜间进行这种类型的查询,这样用户就不会面临任何性能问题。因此,我们计划在S3中创建一个
数据
湖
,这样我们就可以将所有
分析
负载从关系
数据
库转移到OLAP解决方案。 作为第一步,我们需要将
数据
从RDS传输
浏览 7
提问于2020-08-17
得票数 0
回答已采纳
3
回答
数据
湖
中的桌子有什么意义?
azure
、
azure-data-lake
我认为使用
数据
湖
( Data )与
数据
仓库()的全部目的是将ETL (提取、转换、加载)过程转换为让(加载、提取、转换)。难道提取这些
数据
,将其转换并加载到一个表中,就能让我们回到我们开始的地方吗?
浏览 7
提问于2017-10-16
得票数 5
回答已采纳
1
回答
数据
库的凭证传递( Sql )
databricks
、
azure-databricks
、
azure-data-lake-gen2
到目前为止,我们已经为
数据
工程和
数据
科学目的使用了Databricks,但是最近我们已经开始探索新的Databricks Sql
分析
,因为我们有很多SQL
分析
师也想加入这股潮流(对于一些用例)。但是,我注意到的一个
大
障碍是,SQL端点总是需要一个服务主体,用于Azure
数据
湖
Gen2访问。没有选择只使用“凭据通过”而不使用SPN。难道我们就不能仅仅使用一个带凭证传递的高一致性集群来访问data 2(或者一个具有证书传递的单用户标准集群)而不使用任何spn (就像我们在<
浏览 11
提问于2022-02-11
得票数 0
回答已采纳
1
回答
我真的需要一个NoSQL
数据
库吗?
database
、
nosql
背景:试图集成两个独立的系统: Oracle和MS.多个应用程序驻留在每个应用程序上,需要进行特殊
分析
。在这种情况下,用户
数据
库并不特殊,它与其他任何
数据
库一样典型(不需要特殊的社交网络绘图),但是,我认为,在进行
分析
时,单元层次结构将从图形
数据
库中获益最大。第二个NoSQL考虑是,当前的系统不能对系统进行任何特别的
分析
。就像“让它屈服”--首席开发人员曾经对我说过,为高层编写定制脚本,试图对应用程序进行某种
分析
。因此,我正在考虑列/
大
表或文
浏览 3
提问于2015-06-23
得票数 1
回答已采纳
1
回答
U-SQL作业不访问Azure SQL
数据
库。
azure
、
azure-sql-database
、
azure-data-lake
、
u-sql
我试图通过遵循指南,使用Azure
数据
湖
分析
从Azure SQL
数据
库中检索
数据
。我在Azure Data Lake analytics上运行U作业,得到以下错误: 在我的工作运行了几次之后,我发现需要在服务器中添加的IP范围相当<em
浏览 7
提问于2016-01-29
得票数 1
3
回答
什么是大
数据
&什么被归类为大
数据
?
ssis
、
data-mining
、
bigdata
我读过很多文章,但我似乎没有得到一个关于大
数据
到底是什么的完全清晰的答案。在一页中,我看到“对于您的使用来说更大的任何
数据
,都是大
数据
--即100 MB被认为是邮箱的大
数据
,而不是硬盘”。而另一篇文章说“大
数据
通常大于1TB,具有不同的体积/变化/速度,不能存储在一个单一的系统中”。另外,
数据
应该存储在NOSQL中,Hadoop用于转换
数据
。此外,我一直在研究一个解决方案,并想知道是否可以将其归类为一个大
数据
。下面的解决方案的片段,
浏览 5
提问于2016-02-22
得票数 1
1
回答
Azure Sql到Datalake表的azue synapse复制
azure-synapse
我想使用synapse
分析
将
数据
从azure Sql Tabel复制到Datalake存储帐户表中,在Datalake表中我想存储增量负载的表名和最大id,这是否可能
浏览 5
提问于2022-04-09
得票数 0
2
回答
使用Azure
数据
湖
时是否需要
数据
仓库?
azure
、
data-warehouse
、
azure-data-factory
、
azure-data-lake
我正在探索Azure
数据
湖
,我是这个领域的新手。我探索了很多东西,读了很多文章。基本上,我必须从不同来源的
数据
开发Power仪表板。在典型的Server栈中,我可以编写一个ETL (提取、转换、加载)进程,将我的系统
数据
库中的
数据
导入
数据
仓库
数据
库。然后利用SSAS等技术,利用Power实现
数据
仓库。但是我想使用Azure
数据
湖
,我探索了Azure和Azure ( use )。我绘制了如下的架构图。 在
浏览 1
提问于2018-03-15
得票数 3
回答已采纳
2
回答
现代
数据
仓库如何处理频繁的小写作?(尤指)什么时候流
数据
是来源之一?
data-warehouse
、
database-internals
、
kafka
现代
数据
仓库如何处理频繁的小写作?(尤指)什么时候流
数据
是来源之一?例如卡夫卡/动态=> DW(雪花,Teradata,Oracle等)现代
数据
仓库内部架构发生了什么变化?DW本身是否有一个分阶段区域,其中
数据
土地,然后是聚合的,统计
数据</e
浏览 0
提问于2021-10-23
得票数 0
回答已采纳
1
回答
顶点故障触发快速作业中止-在
数据
提取期间引发异常。
azure
、
azure-data-lake
、
u-sql
我正在运行一个
数据
湖
分析
工作,在提取过程中我得到了一个错误。我在脚本中使用文本提取器,也使用我自己的提取器。我试图从一个包含两个列的文件中获取
数据
,其中两个列由一个空格字符分隔。只有当我试图从包含数千行(但只有36 MB
数据
)的文件中获取
数据
时,我才会遇到这个问题,对于较小的文件,所有的东西都能正常工作。我注意到,当顶点总数大于提取节点的顶点数时,异常就会抛出。我在处理其他“
大
”文件(.csv、.tsv)和提取器时遇到了这个问题。有人能告诉我发生了什么吗?
浏览 4
提问于2016-03-22
得票数 2
4
回答
查询分组
sql
、
database
、
mdx
、
graph-databases
、
database-theory
我想了解什么是查询语言的最高级别分组,以及为什么一个组可能与另一个组根本不同。例如,我现在提出的分组(用于一般用途)是: 示例: SQL 例子: XQuery,JSONPath,MQL (mongoDB) 示例: Cypher (Neo4j) 大头熊/熊猫?多维(MDX)
浏览 7
提问于2020-10-27
得票数 7
回答已采纳
16
回答
人们可以使用
分析
器,但为什么不干脆停止程序呢?
performance
、
optimization
、
profiling
如果某个东西使一个单线程程序花费的时间是它的10倍,你可以在上面运行一个
分析
器。你也可以用一个“暂停”按钮来停止它,你会看到它到底在做什么。所以它还没有被精确的测量,但是它已经被精确的发现了,这一点很重要,这一点很重要,因为它可以很容易地被
分析
器发现,比如涉及
数据
状态的东西,而不是程序计数器。
浏览 19
提问于2008-11-05
得票数 45
回答已采纳
13
回答
AWS与EBS与S3 (差异&何时使用?)
amazon-web-services
、
amazon-s3
、
storage
、
amazon-ebs
、
amazon-efs
根据这个问题的标题,AWS、EBS和S3之间的实际区别是什么? 为什么选择S3而不是EFS?它们都存储文件、缩放和复制。我想,对于S3,您必须使用SDK,因为EFS是一个文件系统,您可以使用您选择的编程语言中的标准I/O方法来创建文件。但这是唯一真正的区别
浏览 9
提问于2015-04-11
得票数 388
回答已采纳
6
回答
为什么Perl在生物信息学中被大量使用?
computer-science
、
perl
为什么C++、Matlab或Python不是
大
语言呢?
浏览 0
提问于2011-07-14
得票数 15
回答已采纳
4
回答
与其他格式相比,地板格式的优缺点是什么?
file
、
hadoop
、
hdfs
、
avro
、
parquet
我已经读过:,它提供了一些关于格式的见解,但是我想知道
数据
的访问和
数据
存储是如何在每种格式中完成的。为什么拼花比其他的更有优势?
浏览 14
提问于2016-04-24
得票数 190
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
國際視野/全球供應鏈 區域化數字化趨勢顯著
恭祝新春 携手奋进
我会理事单位光大We谷又添一省级荣誉!
华为发布 eKitStor Xtreme 系列 M.2 闪存条,以及数据湖解决方案
一路财富CEO吴雪秀受邀参加长安俱乐部青领新春团拜会
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券