我正在移动数据到Azure数据湖存储和处理它使用Azure数据湖分析。数据是XML格式的,我正在通过XML抽取器读取它。现在,我想从Azure中访问这些数据,看起来Azure数据湖存储目前还不受直接支持。
用Azure ML使用Azure的可能方法是什么?
发布于 2016-03-23 16:22:08
现在,Azure并不是受支持的源,正如您注意到的。尽管如此,Azure也可以用于将数据写入Azure Blob Store,因此您可以使用它作为一种在used中处理数据的方法,然后将其用于Azure Machine从Blob商店学习处理数据。当Azure ML支持时,您可以切换它。
发布于 2022-01-03 11:30:26
account_name=os.getenv("ADLSGEN2_ACCOUNTNAME_62", "<storage account name>") # ADLS Gen2 account name
tenant_id=os.getenv("ADLSGEN2_TENANT_62", "") # tenant id of service principal
client_id=os.getenv("ADLSGEN2_CLIENTID_62", "") # client id of service principal
client_secret=os.getenv("ADLSGEN2_CLIENT_SECRET_62", "") # the secret of service principal
try:
adlsgen2_datastore = Datastore.get(workspace, adlsgen2_datastore_name)
print("Found ADLS Gen2 datastore with name: %s" % adlsgen2_datastore_name)
datastore_paths = [(adlsgen2_datastore, 'path to data.csv')]
dataset = Dataset.Tabular.from_delimited_files(path=datastore_paths)
df = dataset.to_pandas_dataframe()
display(dataset.to_pandas_dataframe())
datastore = adlsgen2_datastore
dataset = Dataset.Tabular.register_pandas_dataframe(df, datastore, "<DataSetStep>", show_progress=True)
except:
adlsgen2_datastore = Datastore.register_azure_data_lake_gen2(
workspace=workspace,
datastore_name=adlsgen2_datastore_name,
filesystem='fs', # Name of ADLS Gen2 filesystem
account_name=account_name, # ADLS Gen2 account name
tenant_id=tenant_id, # tenant id of service principal
client_id=client_id, # client id of service principal
client_secret=client_secret) # the secret of service principal
https://stackoverflow.com/questions/36127510
复制相似问题