我在一个包含乘客预订的Sql服务器表中有一些航班预订数据。
下面的查询突出显示了所有涉及到的表以及连接
"SELECT distinct * FROM
Booking B
JOIN BookingPassenger BP
ON B.BookingId = BP.BookingId
JOIN PassengerJourneyLeg PJL
ON PJL.PassengerId = BP.PassengerId
JOIN InventoryLeg IL
ON IL.InventoryLegId = PJL.InventoryLegId
join passenge
我们正在建造一个金球数据仓库。我们有一个分期数据库和最后的数据仓库。
我们有一个创建表CustomerTransaction的存储过程。存储过程的最佳位置在哪里?在分期数据库还是数据仓库?或者每个位置的优点/负面是什么?我刚开始创建数据仓库,并试图学习。
create procedure dbo.FactCustomerTransactionImport -- should this be in StagingDB or datawarehouse DB?
as
insert into DWFinal.dbo.FactCustomerTransaction
(
CustomerI
我正在尝试用开源框架来做ETL,我听说过两件事,Apache Beam和Apache Airflow,这两件事最适合整个ETL或ELT,比如Talend、Azure Data Factory等,事实上,我正在尝试用云数据仓库(redshift、azure数据仓库、雪花等)来做所有的事情。哪一个对这些类型的工作更好,如果我能在这两个框架之间进行一些比较,那就太好了。提前谢谢。