我们可以使用交互式集群从数据块在adls2上创建外部表吗？

、

我正在尝试从azure数据块在adls2上创建外部表，在位置上我给出了“abfss://.”。.);; 如果我在这个位置给出了挂载点路径，那么它就可以正常工作了。有没有其他方法可以在没有挂载点的情况下创建表？

浏览 12提问于2020-07-24得票数 0

回答已采纳

1回答

无法通过SSMS访问Azure Synapse火花表

、

我正在经历一个问题，通过SSMS连接到我的星星池集群。在Synapse Studio中，我执行以下步骤：接下来，我创建了一个表，该表指向一个ADLS2文件夹，其中包含一个ADLS2文件夹，其中包含了使用pyspa

浏览 4提问于2021-04-05得票数 0

1回答

Presto Superset查询无法找到新存储帐户的配置属性

、、、、

我们有一个Azure HDInsight集群设置，运行Presto和Superset应用程序连接到它。最近，我们通过更新core-site.xml将一个新的存储帐户加载到集群中，这允许我们从Hive创建一个外部表。我们能够从Hive视图中的新存储帐户中查询外部表，而不会出现问题。在Superset应用程序中，我们能够找到<em

浏览 2提问于2021-09-15得票数 0

回答已采纳

5回答

Hive如何存储数据(从HDFS加载)？

、、、、

在试图理解数据访问层(如Hive )的基本原理时，我需要了解表的数据(在Hive中创建)究竟存储在哪里？我们可以在Hive中创建外部和内部表。由于外部表可以在HDFS或任何其他文件系统中，因此Hive不将此类表的数据存储在仓库中。内部桌子呢？此表将作为Had

浏览 11提问于2015-10-28得票数 4

1回答

SparkR作业处理依赖项

、、、

如何处理依赖关系在(交互式) sparkR作业的情况下？但是我需要一些外部包，例如连接到数据库(Mongo，Cassandra)或读取csv文件。在本地模式下，我可

浏览 4提问于2016-04-07得票数 0

回答已采纳

1回答

定期运行Redshift查询

、、、、

它被定义为AWS中的“数据库”服务。根据我到目前为止所了解到的情况，我们可以从S3或从Hive等外部来源创建表和摄取数据到Redhshift数据库(集群)中。另外，我们可以使用JDBC连接来查询这些表。在Redshift集群中有什么地方可以存储我们

浏览 1提问于2018-03-21得票数 2

回答已采纳

1回答

创建外部表以指向存储在Azure blob中的ORC数据

我在Azure blob中有ORC数据文件，我想通过创建外部表从ADX集群读取这些数据。但是，在创建外部表时，我们似乎不能将orc指定为dataformat。有什么解决办法吗？正如您在下面的屏幕截图中所看到的，当我试图创建一个外部表时，Kusto并没有将ORC显示为选项之一。现在，我

浏览 13提问于2021-06-23得票数 1

回答已采纳

1回答

从远程群集上的Spark运行配置单元查询时，客户端无法通过[TOKEN，KERBEROS]进行身份验证

、、

我们有一个设置，其中我们有两个集群，生产集群A和开发集群B。在集群B中，创建了指向集群A (https://docs.cloudera.com/HDPDocuments/HDP2/HDP-2.6.5/bk_data-access/content/querying-remote-clusters.html我们可以成功地查询

浏览 14提问于2020-07-01得票数 1

2回答

GZ到ORC文件的性能改进

、

请让我知道是否有更快的方式移动(*.gz)到兽人表直接。 1)另一个想法，从*.gz文件到非分区表，而不是创建外部表和将gz文件数据转储到外部表。是否有其他方法可以更快地从Gz加载到外部表。我们正在考虑另外两种方法，比如我们可以使用自定义.exe的ADF来解压缩*.gz文件并上传到Azure。

浏览 8提问于2015-05-06得票数 1

回答已采纳

1回答

提交Azure数据工厂的spark应用程序(Spark )

、、、

我们已经在Azure Kubernetes服务(AKS)上部署了Apache Spark。能够通过CLI 提交星火申请。问题：可以从Azure数据工厂版本2提交spark作业/运行spark应用程序吗？这样，我们就可以从数据工厂组织火花应用程序。

浏览 4提问于2021-08-19得票数 1

3回答

Greenplum: gpfdist文件服务

我以为它读的是外部表。gpfdist是否同时在客户端和服务器上运行？它是如何并行工作的？它是否在多台主机上调用gpfdist，是这样的吗？我只需要你帮我理解大局。在本教程中，我们调用它两次，为什么？(这很令人困惑，因为服务器和客户端在同一台机器上。)

浏览 31提问于2016-06-07得票数 0

1回答

数据库中的存储选项

、、、、

我的公司为我建立了一个数据库帐户，我在那里从s3桶中提取数据。我有传统关系数据库的背景，所以我很难理解databricks。我有以下问题：-I在某个地方读到DBFS也在挂载吗？-We对于公司中的不同团队有不同的集群，我不能访问

浏览 2提问于2019-08-21得票数 9

回答已采纳

1回答

Dataproc:局部蜂巢转移的主要用例是什么？

默认情况下，Dataproc使用主节点上的本地MySQL (图像版本1.5+)数据库作为Hive表元数据存储。使用它的好处和不使用它的缺点是什么？

浏览 2提问于2021-07-15得票数 3

回答已采纳

2回答

在Windows中跨重新启动访问相同的资源

、、

在系统关闭或服务关闭之前，我会在文件/内存中写入一些内容。在下一次系统重新启动时，是否有可能在文件系统加载之前访问磁盘上的相同文件或相同内存？实际需求是这样的，我们有一个位于卷级驱动程序和文件系统driver...in之间的驱动程序，这是驱动程序代码的一部分，我想访问一些内存或文件。卡尔文

浏览 0提问于2009-07-31得票数 3

回答已采纳

1回答

如果没有Hadoop/HDInsight，我可以在Azure数据库上使用Hive吗？

、、、、

说：“每个数据库的部署都有一个中央蜂巢转移.”除了现有蜂巢装置的外部亚稳态外。我有一个Azure Databricks工作区和一个底层星体集群，以及一个存储在DBFS和Blob上的数据文件。我是否需要具有外部亚稳态的HDInsight集群才能创建和使用Hive表？或者我可以使用上面提到的中心亚稳态来创建存储在DBFS或Blob

浏览 0提问于2018-09-07得票数 1

回答已采纳

2回答

Azure数据资源管理器(ADX)与Polybase和Databricks

、、、、

我对ADX的理解我不明白为什么我们需要ADX如果： Azure Synapse有类似的定价模型(集群，每小时)，它还支持流吞食和规模上的临时查询。Azure Synapse支持通过Polybase<

浏览 1提问于2020-05-27得票数 8

回答已采纳

1回答

跨不同网络访问infinispan缓存

、、

在这里，我们有这样一种情况，我们有一个服务需要在集群模式下运行，对于这个服务，我们倾向于使用infinispan来检测在不同机器上运行的服务，并让数据处于并发模式。1)现在，当我们在局域网中运行我们的服务时，一切正常。当第一个服务启动时，它会创建自己的集群，并将其视为主服务。当第二个服务启动时，它会找到这个已经创建的集群，并加入

浏览 1提问于2013-09-12得票数 1

1回答

我们有一个系统，它包含一个用于计算报表的数据管道，还有一个UI层，它可以进行特殊的查询，并在查询后对数据集进行一些特定的计算。我正在考虑将现有的批处理数据处理层迁移到Spark，但我不太确定UI应用程序层。棘手的部分是，来自UI的请求还需要将某些函数应用于数据集。我还没有找到任何查询引擎，比如Elasticsearch，它可以从查询结果中应用自定义函数。因此，我想知道，假设源数据已经缓存在Spark会话中，让UI层直接触发Spark

浏览 1提问于2020-09-09得票数 3

1回答

Azure Synapse .管道.复制数据.没有表的增量负载

、、、

我使用一个非常简单的体系结构将数据从外部源复制到Azure 2中，并通过一个无服务器池(在其中执行一些聚合)将其服务于PowerBI。对于初始负载，我使用了CopyData活动(同步管道)，并将数据存储在拼花文件中。由于parquet / ADLS2不支持对文件的更新操作，所以我正在寻找创建增量加载(水印处理)的最佳实践，而无需使用额外的数据库来查询控件/水印表并运行存储过程来更

浏览 3提问于2022-07-12得票数 0

回答已采纳

2回答

电火花电子病历和外部蜂箱/胶水--可以通过sqlContext丢弃但不能创建表。

、、、、

我正在从运行在EMR上的吡火花写一个数据到外部的蜂巢表。这项工作包括从外部单元表中删除/截断数据，将数据的内容写入上述表，然后将数据从单元写入DynamoDB。我想写到EMR集群上的一个内部表，但现在我希望以后的集群可以使用蜂箱数据。我可以

浏览 4提问于2020-10-22得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

无法通过SSMS访问Azure Synapse火花表

Presto Superset查询无法找到新存储帐户的配置属性

Hive如何存储数据(从HDFS加载)？

SparkR作业处理依赖项

定期运行Redshift查询

创建外部表以指向存储在Azure blob中的ORC数据

从远程群集上的Spark运行配置单元查询时，客户端无法通过[TOKEN，KERBEROS]进行身份验证

GZ到ORC文件的性能改进

提交Azure数据工厂的spark应用程序(Spark )

Greenplum: gpfdist文件服务

数据库中的存储选项

Dataproc:局部蜂巢转移的主要用例是什么？

在Windows中跨重新启动访问相同的资源

如果没有Hadoop/HDInsight，我可以在Azure数据库上使用Hive吗？

Azure数据资源管理器(ADX)与Polybase和Databricks

跨不同网络访问infinispan缓存

火花可以用于实时交互应用吗？

Azure Synapse .管道.复制数据.没有表的增量负载

电火花电子病历和外部蜂箱/胶水--可以通过sqlContext丢弃但不能创建表。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐