如果有人能给我解释一下是什么让Apache Pig成为ETL工具,以及它的反面是什么,我会很高兴。我知道ETL意味着提取、转换和加载数据,Pig就是这么做的,但其他平台也是如此,比如Flink,Spark和R(你获取数据,执行一些操作,然后加载到其他地方),我找不到任何信息说这些工具也被认为是ETL。也许我错过了什么?也许我没有完全理解ETL是什么意思?谢谢。
发布于 2015-03-11 20:36:30
正如你所说的,ETL工具意味着,这个工具可以用来为ETL工具提取、转换和加载data.And。我们将有一个可视化开发的UI。我不确定我们是否可以将猪作为ETL目的的“工具”。但它肯定可以用于ETL进程。this /HIVE是用于此目的的客户端库。
https://stackoverflow.com/questions/28984397
复制相似问题