腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我们
可以
使用
交互式
集群
从
数据
块
在
adls2
上
创建
外部
表
吗
?
、
我正在尝试
从
azure
数据
块
在
adls2
上
创建
外部
表
,在位置
上
我给出了“abfss://.”。.);; 如果我在这个位置给出了挂载点路径,那么它就
可以
正常工作了。有没有其他方法
可以
在
没有挂载点的情况下
创建
表
?
浏览 12
提问于2020-07-24
得票数 0
回答已采纳
1
回答
无法通过SSMS访问Azure Synapse火花
表
、
我正在经历一个问题,通过SSMS连接到我的星星池
集群
。
在
Synapse Studio中,我执行以下步骤: 接下来,我
创建
了一个
表
,该
表
指向一个
ADLS2
文件夹,其中包含一个
ADLS2
文件夹,其中包含了
使用
pyspa
浏览 4
提问于2021-04-05
得票数 0
1
回答
Presto Superset查询无法找到新存储帐户的配置属性
、
、
、
、
我们
有一个Azure HDInsight
集群
设置,运行Presto和Superset应用程序连接到它。最近,
我们
通过更新core-site.xml将一个新的存储帐户加载到
集群
中,这允许
我们
从
Hive
创建
一个
外部
表
。
我们
能够
从
Hive视图中的新存储帐户中查询
外部
表
,而不会出现问题。
在
Superset应用程序中,
我们
能够找到<em
浏览 2
提问于2021-09-15
得票数 0
回答已采纳
5
回答
Hive如何存储
数据
(
从
HDFS加载)?
、
、
、
、
在
试图理解
数据
访问层(如Hive )的基本原理时,我需要了解表的
数据
(
在
Hive中
创建
)究竟存储在哪里?
我们
可以
在
Hive中
创建
外部
和内部
表
。由于
外部
表
可以
在
HDFS或任何其他文件系统中,因此Hive不将此类
表
的
数据
存储
在
仓库中。内部桌子呢?此
表
将作为Had
浏览 11
提问于2015-10-28
得票数 4
1
回答
SparkR作业处理依赖项
、
、
、
如何处理依赖关系
在
(
交互式
) sparkR作业的情况下?但是我需要一些
外部
包,例如连接到
数据
库(Mongo,Cassandra)或读取csv文件。
在
本地模式下,我
可
浏览 4
提问于2016-04-07
得票数 0
回答已采纳
1
回答
定期运行Redshift查询
、
、
、
、
它被定义为AWS中的“
数据
库”服务。根据我到目前为止所了解到的情况,
我们
可以
从
S3或
从
Hive等
外部
来源
创建
表
和摄取
数据
到Redhshift
数据
库(
集群
)中。另外,
我们
可以
使用
JDBC连接来查询这些
表
。
在
Redshift
集群
中有什么地方
可以
存储
我们
浏览 1
提问于2018-03-21
得票数 2
回答已采纳
1
回答
创建
外部
表
以指向存储
在
Azure blob中的ORC
数据
我
在
Azure blob中有ORC
数据
文件,我想通过
创建
外部
表
从
ADX
集群
读取这些
数据
。但是,
在
创建
外部
表
时,
我们
似乎不能将orc指定为dataformat。有什么解决办法
吗
?正如您在下面的屏幕截图中所看到的,当我试图
创建
一个
外部
表
时,Kusto并没有将ORC显示为选项之一。现在,我
浏览 13
提问于2021-06-23
得票数 1
回答已采纳
1
回答
从
远程群集
上
的Spark运行配置单元查询时,客户端无法通过[TOKEN,KERBEROS]进行身份验证
、
、
我们
有一个设置,其中
我们
有两个
集群
,生产
集群
A和开发
集群
B。
在
集群
B中,
创建
了指向
集群
A (https://docs.cloudera.com/HDPDocuments/HDP2/HDP-2.6.5/bk_data-access/content/querying-remote-clusters.html
我们
可以
成功地查询
浏览 14
提问于2020-07-01
得票数 1
2
回答
GZ到ORC文件的性能改进
、
请让我知道是否有更快的方式移动(*.gz)到兽人
表
直接。 1)另一个想法,
从
*.gz文件到非分区
表
,而不是
创建
外部
表
和将gz文件
数据
转储到
外部
表
。是否有其他方法
可以
更快地
从
Gz加载到
外部
表
。
我们
正在考虑另外两种方法,比如
我们
可以
使用
自定义.exe的ADF来解压缩*.gz文件并上传到Azure。
浏览 8
提问于2015-05-06
得票数 1
回答已采纳
1
回答
提交Azure
数据
工厂的spark应用程序(Spark )
、
、
、
我们
已经
在
Azure Kubernetes服务(AKS)上部署了Apache Spark。 能够通过CLI 提交星火申请。问题:
可以
从
Azure
数据
工厂版本2提交spark作业/运行spark应用程序
吗
?这样,
我们
就
可以
从
数据
工厂组织火花应用程序。
浏览 4
提问于2021-08-19
得票数 1
3
回答
Greenplum: gpfdist文件服务
我以为它读的是
外部
表
。gpfdist是否同时
在
客户端和服务器
上
运行?它是如何并行工作的?它是否
在
多台主机上调用gpfdist,是这样的
吗
? 我只需要你帮我理解大局。
在
本教程中,
我们
调用它两次,为什么?(这很令人困惑,因为服务器和客户端
在
同一台机器
上
。)
浏览 31
提问于2016-06-07
得票数 0
1
回答
数据
库中的存储选项
、
、
、
、
我的公司为我建立了一个
数据
库帐户,我在那里
从
s3桶中提取
数据
。我有传统关系
数据
库的背景,所以我很难理解databricks。我有以下问题:-I
在
某个地方读到DBFS也
在
挂载
吗
?-We对于公司中的不同团队有不同的
集群
,我不能访问
浏览 2
提问于2019-08-21
得票数 9
回答已采纳
1
回答
Dataproc:局部蜂巢转移的主要用例是什么?
默认情况下,Dataproc
使用
主节点
上
的本地MySQL (图像版本1.5+)
数据
库作为Hive
表
元
数据
存储。
使用
它的好处和不
使用
它的缺点是什么?
浏览 2
提问于2021-07-15
得票数 3
回答已采纳
2
回答
在
Windows中跨重新启动访问相同的资源
、
、
在
系统关闭或服务关闭之前,我会在文件/内存中写入一些内容。在下一次系统重新启动时,是否有可能在文件系统加载之前访问磁盘上的相同文件或相同内存?实际需求是这样的,
我们
有一个位于卷级驱动程序和文件系统driver...in之间的驱动程序,这是驱动程序代码的一部分,我想访问一些内存或文件。卡尔文
浏览 0
提问于2009-07-31
得票数 3
回答已采纳
1
回答
如果没有Hadoop/HDInsight,我
可以
在
Azure
数据
库
上
使用
Hive
吗
?
、
、
、
、
说:“每个
数据
库的部署都有一个中央蜂巢转移.”除了现有蜂巢装置的
外部
亚稳态外。 我有一个Azure Databricks工作区和一个底层星体
集群
,以及一个存储
在
DBFS和Blob
上
的
数据
文件。我是否需要具有
外部
亚稳态的HDInsight
集群
才能
创建
和
使用
Hive
表
?或者我
可以
使用
上面提到的中心亚稳态来
创建
存储
在
DBFS或Blob
浏览 0
提问于2018-09-07
得票数 1
回答已采纳
2
回答
Azure
数据
资源管理器(ADX)与Polybase和Databricks
、
、
、
、
我对ADX的理解我不明白为什么
我们
需要ADX如果: Azure Synapse有类似的定价模型(
集群
,每小时),它还支持流吞食和规模
上
的临时查询。Azure Synapse支持通过Polybase<
浏览 1
提问于2020-05-27
得票数 8
回答已采纳
1
回答
跨不同网络访问infinispan缓存
、
、
在这里,
我们
有这样一种情况,
我们
有一个服务需要在
集群
模式下运行,对于这个服务,
我们
倾向于
使用
infinispan来检测
在
不同机器
上
运行的服务,并让
数据
处于并发模式。1)现在,当
我们
在
局域网中运行
我们
的服务时,一切正常。当第一个服务启动时,它会
创建
自己的
集群
,并将其视为主服务。当第二个服务启动时,它会找到这个已经
创建
的
集群
,并加入
浏览 1
提问于2013-09-12
得票数 1
1
回答
火花
可以
用于实时交互应用
吗
?
、
我们
有一个系统,它包含一个用于计算报表的
数据
管道,还有一个UI层,它
可以
进行特殊的查询,并在查询后对
数据
集进行一些特定的计算。我正在考虑将现有的批处理
数据
处理层迁移到Spark,但我不太确定UI应用程序层。 棘手的部分是,来自UI的请求还需要将某些函数应用于
数据
集。我还没有找到任何查询引擎,比如Elasticsearch,它
可以
从
查询结果中应用自定义函数。因此,我想知道,假设源
数据
已经缓存在Spark会话中,让UI层直接触发Spark
浏览 1
提问于2020-09-09
得票数 3
1
回答
Azure Synapse .管道.复制
数据
.没有
表
的增量负载
、
、
、
我
使用
一个非常简单的体系结构将
数据
从
外部
源复制到Azure 2中,并通过一个无服务器池(在其中执行一些聚合)将其服务于PowerBI。对于初始负载,我
使用
了CopyData活动(同步管道),并将
数据
存储
在
拼花文件中。由于parquet /
ADLS2
不支持对文件的更新操作,所以我正在寻找
创建
增量加载(水印处理)的最佳实践,而无需
使用
额外的
数据
库来查询控件/水印表并运行存储过程来更
浏览 3
提问于2022-07-12
得票数 0
回答已采纳
2
回答
电火花电子病历和
外部
蜂箱/胶水--
可以
通过sqlContext丢弃但不能
创建
表
。
、
、
、
、
我正在从运行在EMR
上
的吡火花写一个
数据
到
外部
的蜂巢
表
。这项工作包括
从
外部
单元
表
中删除/截断
数据
,将
数据
的内容写入上述
表
,然后将
数据
从
单元写入DynamoDB。我想写到EMR
集群
上
的一个内部
表
,但现在我希望以后的
集群
可以
使用
蜂箱
数据
。我
可以
浏览 4
提问于2020-10-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
超详细的oracle DB体系结构图 三
Hive3连接RDBMS和使用函数
想要月入30k以上,那么这门技术是必须了解的
用Hive搭建数据仓库(五)
分布式NoSQL数据库Pika——从单机到集群
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券