我的客户希望我使用Alteryx实现ETL过程,因为他们有它的许可证。我对Alteryx是否是ETL工具感到困惑。我相信Alteryx通常被用来为Tableau数据可视化工具准备数据。
请告知它是否是ETL工具?它与SSIS有何不同?
谢谢,
发布于 2015-05-27 03:00:21
Alteryx是一个数据准备/高级分析应用程序。人们以许多不同的方式使用它,因为它允许数据准备,空间分析和预测。
我与许多客户一起工作,他们选择使用Alteryx纯粹是因为它的ETL功能将数据从一个数据库移动到另一个数据库,例如,我曾与一个客户合作,他使用Alteryx将他们的负载从MySQL自动加载到他们的Amazon Redshift数据库中,另一个客户正在使用数据引擎,以及许多其他涉及一系列数据输入的示例(Alteryx支持从自定义API到-> ->的一切)。
如果你已经在使用SSIS,那么你会发现Alteryx是一股新鲜的空气。老实说,我以前一直在使用SSIS,后来发现Alteryx的开发速度要快得多。它对数据的更改更加宽容,并允许更紧密地集成许多不同的数据源。新的数据库内工具提供了与SQL更紧密的集成,这在以前是可能的,允许工作在数据库内完成。
最后,与SSIS相比,我认为您会发现Alteryx非常容易学习。他们网站上的在线培训视频将根据您的需要为您提供尽可能多的介绍。
尽情享受吧,我想你会喜欢这种体验的。
克里斯
发布于 2015-05-27 06:14:12
只要您有Alteryx服务器,Alteryx就可以用于ETL。我已经将它用于许多用例,尤其是在云和数据库之间。
在我个人看来,一些东西使它明显优于SSIS:
流可以从服务器上的命令行运行,我发现的最简单的方法(除了使用Alteryx自己的调度器之外)是另存为"App",然后使用Alteryx引擎可执行文件从命令行运行,通过xml文件传递参数。您可以通过点击魔术棒按钮来保存流中的示例xml参数文件(在将流保存为.yxwz (应用程序)之后)。这将打开一个面板,允许您设置变量,并且该面板有一个方便的“保存”按钮,可以生成正确格式的xml文件。
在流本身中,通过操作工具或模块级参数(User.*)对环境设置等内容进行参数化-例如,您可以在字段中使用%User.Your变量名称%在输入上设置数据库服务器。
错误日志通常是优秀的(识别失败的工具,有用的错误消息),命令行抛出有用的错误级别编号,所以使用一些第三方调度器(或者只使用Alteryx Server自己的调度器)进行调度是非常琐碎的。
显然,如果你需要做任何严重的数据操作,旋转等,那么它无疑是我使用过的最简单的工具。
发布于 2015-05-26 17:54:06
是的,Alteryx是一个ETL和数据争论工具,但它比纯ETL做了更多的事情。Alteryx将预先烘焙的连接(Experian / Tableau等)选项与一系列嵌入式功能(如数据挖掘、地理空间、数据清理)捆绑在一起,在一个产品中提供了一套工具。
如果你所寻找的只是基本的a->b ETL映射,并且你不需要Alteryx所具有的附加功能,那么像SSIS这样的廉价产品往往就足够了。
https://stackoverflow.com/questions/30452321
复制相似问题