我试图找出数据仓库、集群数据处理和用于查询数据仓库的工具/基础结构之间的区别(工具/服务/程序)Hadoop Cluster for DistributedFunctions for querying data from a data warehouse在上面的例子中,数据仓库到底是什么我天真的头脑认为这是关系数据库或NoSQL数据库在上面的
我们一直在审查微软的现代数据仓库架构,其中提到了使用Azure Data Factory将结构化和非结构化数据拉入Azure Data Lake。我也参加了很多关于这个主题的演讲,但大多数人对data Lake是否是结构化数据的好去处意见不一。就背景而言,我们正在寻找一个单一的消费窗格-无论是使用Power BI的最终用户报告,还是Azure数据仓库/本地数据仓库的素材。
现状:考虑解决方案:
其想法是将关于流中事件的数据推送到外部数据库。BPM中的典型事件是:创建了新的流程实例、状态更改了、执行了流程中的一个步骤或更改了流程实例的状态。数据库是除了星型模式之外的有趣的替代方案之一。让我们假设有两个集线器: PI (流程项实例)和OU (组织单元)和一个链接表LINK_PI_OU。每次将流程项分配给组织单位时,将向链接表中添加新的行。链接表中的LOAD_DATE包含添加此记录时的日期时间。带有最新LOA