我们有一个使用mongoDB (在虚拟机上运行)和Azure SQL dbs托管在Azure上的应用程序。我们的想法是构建一个基本的数据分析管道来“连接”这两个数据库之间的数据,并使用power BI可视化地显示相同的数据。
例如,我们在SQL中有一个具有唯一"id“的"user”表,在mongo中有一个"data“表,它引用"id”+ SQL中引用“id”的其他表。因此,我们希望分析基于用户的数据内容,并可能根据需要进一步连接其他表。
azure data lake + power BI是否足以实现此案例?或者我们需要azure数据分析或azure synapse来实现这一点?
发布于 2020-09-15 15:41:07
Azure Data Lake ( ADL )和Power BI本身不能构建管道,ADL只是一个存储区域,Power BI是一个非常轻量级的ETL工具,受功能和容量的限制。
正如你提到的Azure Synapse,强烈建议你使用它拥有更好的计算能力。这将能够有一个定义的管道来协调数据移动到数据湖中,然后进行处理来转换数据。
Power BI本身无法做到这一点,因为如果运行Pro,您仍将受到数据流和1 1GB数据集大小的限制。Azure Synapse包含Azure数据工厂管道、Apache Spark和Azure SQL数据仓库,因此您可以在Spark和SQL之间选择用于数据转换步骤,因为两者都将连接到Data Lake。
注意: Azure Data Lake Analytics (ADLA) (和USQL)不是MS的主要关注点,也从未被广泛使用。Azure Databricks和Azure Synapse with Spark在MS.的所有现代数据管道和体系结构示例中都取代了ADLA。
https://stackoverflow.com/questions/63894782
复制相似问题