我正在尝试用开源框架来做ETL,我听说过两件事,Apache Beam和Apache Airflow,这两件事最适合整个ETL或ELT,比如Talend、Azure Data Factory等,事实上,我正在尝试用云数据仓库(redshift、azure数据仓库、雪花等)来做所有的事情。哪一个对这些类型的工作更好,如果我能在这两个框架之间进行一些比较,那就太好了。提前谢谢。
我必须修改一个数据仓库。一个复杂的ETL正在修改数据仓库。
我在几个表上添加了一个索引视图,以使事情变得简单和快速。代码如下所示:
CREATE VIEW
my_current_view WITH schemabinding
AS
SELECT ...
FROM table1 ...
WHERE ...
GROUP BY ...
CREATE UNIQUE CLUSTERED INDEX idx1 ON my_current_view (tranid)
现在ETL失败了,它收到了以下消息:
执行查询"truncate table1“的失败,错误如下:”无法截断表'tabl