首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >ETL工具和构建工具

ETL工具和构建工具
EN

Stack Overflow用户
提问于 2009-11-12 09:45:14
回答 5查看 3.6K关注 0票数 2

我熟悉软件自动构建工具(例如automated build Studio)。现在我来看看ETL工具。

我脑海中浮现的一件事是,我可以通过使用软件构建工具在ETL工具中做任何我能做的事情。ETL工具是为数据加载和操作量身定做的,需要大量的脚本才能完成这项工作。另一方面,软件构建工具具有足够的通用性,可以做任何工作,包括编写脚本以从任何格式提取、转换和加载任何数据。

我说的对吗?

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2009-11-13 21:53:31

正确的做法是,您可以推出自己的ETL脚本,这些脚本是使用您喜欢的开发工具编写的。话虽如此,ETL工作通常很大(因为没有更好的词),需要相当多的管理和对微小细节的关注(比如编程)。ETL工具允许开发人员专注于ETL任务,而不是编写和调试代码,尽管这也是其中的一部分。市面上有一些开源工具,因此在开始定制开发之前,您可以大致了解一般工具的功能。例如,更昂贵的工具提供数据谱系,这意味着您可以(以图形方式)跟踪报告中的每个字段,通过所有转换(包括版本)返回到原始表;在公司合并之后,这是一项相当艰巨的任务。

例如,;如果您有MS SQL Server,则可以获取SSIS。另请查看是否可以找到。

票数 3
EN

Stack Overflow用户

发布于 2010-05-20 09:31:29

如果您有许多进程要构建,那么ETL工具的好处就会最大化(我喜欢jsf80238的帖子将其比作100个钉子中的锤子)。真正的ETL工具的一个关键好处是它们生成的元数据和操作支持。在Perl/Ruby/etc中编写脚本相当容易,但是当需要跟踪问题或者作者以外的人必须找出什么是wrong.The能力时,管理员/支持人员就会很快发现哪些地方出了问题,哪些地方值得花钱。我用过微软的SSIS (2005 - OK)和最新的Pentaho PDI (相当不错)。在我的工作场所,商业用户( 99%的时间里没有IT支持)使用的是Pentaho ETL GUI,它已经取代了一堆错综复杂的SQL脚本和电子表格。说出你喜欢的其余部分,但在我看来,ETL组件是非常好的“物超所值”。

票数 1
EN

Stack Overflow用户

发布于 2011-11-04 03:07:25

ETL的全部业务都是以数据源与目的数据源不兼容为前提的。很多时候,转储源数据的人可能并不认为这些数据需要收集和聚合。这就是为什么ETL的整个业务是存在的。

商业ETL工具不会神奇地读取源输入并根据目标数据库的规则转换数据。必须定义规则并将其提供给ETL工具。有趣的是,许多公司都提供培训!如何使用他们专有的脚本语言。因此,这并不总是那么容易。但对于非程序员来说,这可能是首选的方法。

就我个人而言,我认为用Perl这样的语言编写专有ETL工具总是更容易一些。只需编写一个状态机算法来撕裂源数据并将其转换为所需的格式。我使用Perl将文件传输到机器中,读取文件,转换数据,然后将其加载到数据库中。这始终是一个更好的解决方案,如果精通Perl或类似的语言,或者可以雇佣懂Perl的人,速度会快得多。

最后一点,从结束开始。以结构化格式转储您的源数据,以帮助您公司中想要聚合和研究的分析小组。这将使ETL程序更容易和更快地开发。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1719348

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档