我刚刚开始进行数据分析,需要使用来分析大容量的数据。在计划使用Databricks笔记本进行分析时,我遇到了不同的存储选项来加载数据( a) DBFS --来自Databricks的默认文件系统b) Azure data Lake (ADLS)和c) Azure Blob Storage。看起来,项目(b)和(c)可以挂载到工作区中,以检索用于分析的数据。
有了以上的理解,我可以澄清以下问题吗?
在Databricks上下文中使用这些存储选项有什么不同?DBFS和ADLS是否结合了HDFS的文件管理原则,比如将文件分成块、名称节点、数据节点等?
如果我安装Azure Blob存储容器来