Databrick -从装载的文件存储中读取BLOB

文章/答案/技术大牛

发布

1回答

： sas_token = "<my sas key>" source = "wasbs://<container>@<storageaccount>.blob.core.windows.net<storageaccount>.blob.core.windows.net": sas_token}) 这看起来运行得很好。我很确定我的sas密钥是正确的。

浏览 34提问于2019-01-14得票数 1

1回答

从Databricks访问ADLS第二代存储

、、、

我正在尝试使用Python从Databricks Notebook读取ADLS Gen 2 Storage中的文件。然而，存储容器将其公共访问级别设置为“私有”。我拥有存储帐户参与者和存储Blob数据参与者访问权限。如何允许Databrick读取和写入ADLS存储？

浏览 27提问于2020-12-24得票数 0

1回答

如何从Azure ADLS容器读取.xpt格式文件并转换为csv格式

、、

将.xpt格式文件从URL下载到Databrick-Python记事本中的blob容器。 library = xpor

浏览 28提问于2022-08-07得票数 0

回答已采纳

1回答

Azure DataBrick PYTHONPATH指着进口车轮？

、

我成功地创建了我的python项目的python轮子，下面是从这里开始的简单步骤：%pip install -r /dbfs/mnt/testdb-blob-container1/requirements.txt 然后，我通过Az

浏览 1提问于2021-03-28得票数 0

2回答

使用azure databricks读取azure databricks日志json文件

、、、、

我已经通过启用诊断设置将数据砖日志发送到存储帐户，现在我必须使用azure数据砖读取这些日志以进行高级分析。当我尝试挂载路径时，它可以工作，但显示为无法工作。." + storageAccountName + ".blob.core.windows.net" df = spark.read.json("

浏览 40提问于2021-11-23得票数 1

1回答

什么是一个好的方式添加多个秘密在蔚蓝的密钥库一次？

、、

我有一个要求存储多个密钥库的秘密进入Azure金库，所有在一次使用Azure管道。我的问题是，我不能使用变量文件加载所有的秘密，并使用Set-AzKeyVaultSecret作为变量文件驻留在回购。你介不介意让我知道最好的方式来装载秘密，而不留下任何痕迹的秘密在回购？也许从存储blob中读取CSV文件？有什么想法吗？

浏览 3提问于2021-11-05得票数 0

回答已采纳

3回答

在Linux中将azure blob存储挂载为驱动器

、

是否有一种方法可以将Azure blob帐户挂载为linux计算机中的驱动器，并使文件在Azure门户中显示为文件blob？我知道我可以将Azure blob挂载为磁盘，但当我挂载完成时，我只有一个磁盘。我希望从Azure VM备份一些关键文件，并不是真的想要装配SDK调用。我宁愿使用cron rsync目录--附加的好处:它可以修剪。我熟悉和，但它们都需要我在命令行中烘焙azur

浏览 4提问于2018-06-19得票数 0

1回答

Azure数据库-成本优化

、、

我的Azure Databrick的很大一部分费用都花在了存储帐户上。作为"Azure databricks -成本优化“步骤的一部分，考虑将数据(即增量表、视图、函数等)存储在挂载对象存储(如Blob存储)中，而不是在DBFS根中存储数据。这样我就可以使用Blob存储的冷/存档层来降低成本。这种B

浏览 2提问于2022-10-26得票数 1

回答已采纳

2回答

如何在虚拟磁盘驱动程序中转换azure blob存储

、、、

你好，我实际上正在处理Azure服务，我想知道是否可以将azure blob存储用作虚拟机硬盘驱动器？如果可能，我们是否可以通过包含虚拟机来将blob存储包括在VNet中？

浏览 2提问于2017-02-27得票数 0

1回答

我们的组织运行着Azure上的数据库，数据科学家和分析人员主要用于笔记本，以便进行特别的分析和探索。我们还为不需要火花的ETL工作流运行Kubernetes集群。我们希望使用达美湖作为我们的存储层，其中数据库和库伯奈特都可以读写作为头等舱公民。目前，我们的Kubernetes作业直接将parquets写到blob存储，另外还有一个作业可以将databricks集群中的数据加载到Databrick<

浏览 3提问于2021-08-12得票数 2

回答已采纳

1回答

不能批量装载。文件"csv“不存在，或者您没有文件访问权限-- Azure

、、、、

我正试图从Azure blob存储中导入一个文件到Azure托管实例中。所以首先我创建了一个额外的数据源WITH ( TYPE = BLOB_STORAGE,LOCATION = 'https://abcd.blob.core.windows.net/testFolder/', 然后将我<

浏览 1提问于2018-10-08得票数 1

1回答

在android中加密SD卡中的文件

、

我正在开发一个应用程序，需要从SD卡的文件和加密，并保存在SD的card.Is有什么办法吗?请帮助。谢谢

浏览 0提问于2011-11-30得票数 0

1回答

从蔚蓝的斑点中读取多个并行文件

、、

我想从一个蓝色的小文件中读到一堆，这可以是1k-100 k文件的顺序--加起来总共只有几个1TB。我必须在python中处理这个文件，处理它本身并不重，但是从blob读取文件确实需要时间。这方面的另一个限制因素是，在我处理第一个文件时，会写入新文件。我正在寻找这样做的选项，是否可以使用dask并行读取blob

浏览 2提问于2021-01-11得票数 1

回答已采纳

1回答

如何在Databricks中读取/加载本地文件？

、、、、

除了导航到Databricks上的“Data”>“Add Data”之外，是否还可以读取位于本地计算机中的文件。在我过去使用Databrick的经验中，当使用s3存储桶时，我能够通过如下方式指定路径来读取和加载数据帧： df = spark.read.format('delta').load('<path>')有没有办法使用databricks读取</

浏览 132提问于2020-10-30得票数 2

2回答

在天蓝色blob存储中保存matplotlib图

、、

现在我想把这个图保存在azure存储上，但是我找不到任何python来做同样的事情。fig, ax = plt.subplots()word_cloud = WordCloud(width = 8000, height =

浏览 1提问于2019-08-19得票数 2

4回答

将Matplotlib输出保存到Databricks上的Blob存储

、、

我试图使用以下提供的方法将matplotlib图写入Azure blob存储区：。但是，当我将代码中的路径替换为我知道这个错误 Errno 2没有这样的文件或目录：'wasbs://test@someblob.blob.core.windows.

浏览 4提问于2020-02-12得票数 2

回答已采纳

3回答

为什么雪管没有装载所有的数据

我有数据装载问题，从蓝珠到雪花..。我已经创建了完整的过程(存储，通知集成，文件格式，阶段，管道)。因此，当截断表和创建管道时，它只加载7天的文件，而在azure blob中存在1年的文件。

浏览 3提问于2022-06-19得票数 0

3回答

Azure Blob存储与文件服务

、、

请纠正我的错误。从我到目前为止在这个主题上的阅读，对我来说，Azure Blob存储和文件服务都提供了在模仿文件系统的分层结构中存储文件和文件夹(我知道Blob可以存储任何二进制对象，但任何序列化的二进制流最终都只是一个文件)的能力。只有访问它们的API略有不同，因为

浏览 0提问于2014-07-22得票数 148

回答已采纳

1回答

我是否可以将Azure存储帐户作为驱动器号装载到我的Azure网站？

、、、

我有一个不能修改的PHP应用程序，该应用程序的一部分接受来自最终用户的上传。我不想将这些上传(可能很大)存储到我的Azure网站存储分配中，因此我宁愿将它们定向到Azure存储帐户。是否有某种方法可以将Azure存储帐户作为简单的驱动器号装载到我的网站，以便我可以将文件保存到该帐户？

浏览 2提问于2012-12-13得票数 2

回答已采纳

1回答

无法从synapse spark scala笔记本读取csv文件

我正在尝试从synapse notebook读取csv文件，但它给出了一个错误路径不存在。我读过很多文档，说在blob存储或synapse工作空间中配置一些东西来读取azure blob存储。我正在尝试从blob存储读取csv文件，而不是从数据湖gen2读取。

浏览 22提问于2021-10-31得票数 0

点击加载更多