我正在探索Azure数据湖,我是这个领域的新手。我探索了很多东西,读了很多文章。基本上,我必须从不同来源的数据开发Power仪表板。
在典型的Server栈中,我可以编写一个ETL (提取、转换、加载)进程,将我的系统数据库中的数据导入数据仓库数据库。然后利用SSAS等技术,利用Power实现数据仓库。
但是我想使用Azure数据湖,我探索了Azure和Azure ( use )。我绘制了如下的架构图。
发布于 2018-03-15 23:15:15
1 & 2)目前只对允许PowerBI直接对其进行查询提供有限的支持。如果您的数据太大(我相信大于10 in ),那么PowerBI就不能直接工作在ADLS帐户中的数据上。在这种情况下,我建议将ADLS中的处理数据移动到SQL或,因为这允许PowerBI对更多的数据进行操作。您可以使用Azure data移动数据,如果将数据移动到SQL,则可以使用Polybase。
3) A数据湖仍然与数据仓库不同,它们有各自的优点和弱点。数据池最适合存储原始或稍微处理过的数据,这些数据可能有多种格式和模式。使用Azure处理和过滤这些数据之后,您可以将该数据移动到SQL中进行交互式分析和数据管理(但代价是模式的灵活性)。
4)取决于您的用例。如果您计划继续处理ADLS中的数据,我建议您将其输出到ADLS表中以获得更好的性能。但是,如果您需要将这些数据传递到另一个服务,那么CSV是一个很好的选择。您可以在我们的GitHub上找到更多的输出程序,比如JSON和XML。
发布于 2018-09-09 19:37:21
这个答案可能不是及时的,但是我尝试过的更类似于您以前的经验的是创建一个Azure Analysis实例。您可以创建一个表格模型或mdx模型,将大量数据插入内存并从power连接到它。“唯一”的收获是它可以很快变得昂贵。AAS的一大特点是,构建表格模型的接口几乎遵循power查询并使用dax。
而且我相信现在adla商店基本上已经不喜欢直接使用blob存储了,所以基本上你会使用数据-> blob -> dla -> aas -> pbi。
https://stackoverflow.com/questions/49309191
复制相似问题