在我工作的地方,我们使用的是内部ETL解决方案,它是本土开发的,已经存在了5-10年。我仍然是我的数据分析工作的新手,但我想知道ETL工具的存在。这对我来说是个新的领域。
我的处境和工作基本上是
我想我真正的问题是,鉴于我的工作,有什么好的ETL套件,我可以查看和比较我的内部工具?这是更多的研究其他选择。最终,我要么建议一个新的解决方案,要么获得改进我们当前应用程序的选项/想法。
发布于 2011-02-03 16:32:35
(五旬节数据集成(又名水壶)是一个开源的ETL工具,是更大的五旬节BI套件的一部分。
我一直在用你描述的那种方式。我可以在大约15分钟内完成一个快速的临时请求,或者我可以花费数天甚至几周的时间整理一组非常健壮的转换,以创建每天工作的设置。
它的优点是既支持命令行界面,又支持用于开发转换和作业的GUI。它可以独立运行,也可以使用从服务器集群运行。
我发现它非常灵活,有着大量的社区支持和动力。
一些商业的ETL套房是IBM信息层数据和Informatica PowerCenter。我以前支持数据存储,Informatica用于许多大型BI项目。
发布于 2011-02-03 15:40:39
有大量的开源和专有的ETL工具。但真正的问题是,为什么你需要改变你目前的制度?
你手工做的事情太多了吗?设置真的很慢还是容易出错?你的公司想要迁移到的新硬件上,它不起作用吗?这些都是调查外部选择的充分理由。
但是,如果只是想看看什么是可用的,只是为了取代当前的系统,以某种神奇的东西,这是一个很难推销作为一个商业主张。由于成本和风险很少被证明是合理的,大多数管理人员都不愿意改变一个旧的、但运行良好的系统,转而采用一个新的系统。
发布于 2011-12-08 07:23:59
三位主要的商业竞争者是:
Informatica PowerCenter --可能是最好的品种,非常干净的图形界面和非常一致的API。
IBMs InfoSphere DataStage --这些工具的“爷爷”。它已经存在了很长一段时间,所以它的高度调整和有很多选择。相反,随着多年来编码风格的改变,它的实现和API也不一致。此外,优秀的“并行版本”实际上是另一个产品螺栓上。
来自同名公司的AbIntio --从来没有亲自处理过这个问题,而且公司非常神秘,所以在你成为一个真正的客户之前,很难得到详细的信息。但我有很好的权威,这是最快的工具,可以在双倍的快速时间内移动大量的数据。
请注意,所有这些都是大票项目。
https://softwareengineering.stackexchange.com/questions/43155
复制相似问题