首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在数据库上用Pyspark访问Azure ADLS gen2

在数据库上用Pyspark访问Azure ADLS gen2
EN

Stack Overflow用户
提问于 2021-10-05 08:54:43
回答 2查看 1.4K关注 0票数 3

我正在努力学习星火,数据库和Azure。

我正在尝试使用Pyspark从Databricks访问GEN2。我找不到合适的方法,我相信这很简单,但我失败了。

目前,我每次收到以下信息:

代码语言:javascript
运行
复制
Unable to access container {name} in account {name} using anonymous
credentials, and no credentials found for them in the configuration.

我已经运行了GEN2 +,我有一个SAS_URI要访问。

到目前为止,我尝试的是:(基于这个链接:https://learn.microsoft.com/pl-pl/azure/databricks/data/data-sources/azure/adls-gen2/azure-datalake-gen2-sas-access):

代码语言:javascript
运行
复制
spark.conf.set(f"fs.azure.account.auth.type.{STORAGE_ACCOUNT_NAME}.dfs.core.windows.net", {SAS_URI})
spark.conf.set(f"fs.azure.sas.token.provider.type.{STORAGE_ACCOUNT_NAME}.dfs.core.windows.net", {SAS_URI})

然后接触到数据:

代码语言:javascript
运行
复制
sd_xxx = spark.read.parquet(f"wasbs://{CONTAINER_NAME}@{STORAGE_ACCOUNT_NAME}.dfs.core.windows.net/{proper_path_to_files/}")
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-10-05 13:51:03

您的配置不正确。第一个参数应该设置为SAS值,而第二个参数是返回SAS令牌的Scala/Java类的名称,您不能只使用带有SAS信息的URI,您需要实现一些自定义代码。

如果您想使用wasbs协议访问Azure博客存储,虽然它可以用于访问ADLS Gen2 (不建议使用),但是您需要使用blob.core.windows.net而不是dfs.core.windows.net,并且还需要设置纠正Azure Blob访问的火花属性

票数 4
EN

Stack Overflow用户

发布于 2021-10-05 13:56:24

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69447499

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档