首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用ETL工具按列值将数据拆分为不确定的表数

使用ETL工具按列值将数据拆分为不确定的表数
EN

Stack Overflow用户
提问于 2012-10-22 15:50:31
回答 3查看 1.6K关注 0票数 4

我试图使用根据给定列的值将表拆分为多个表。假设这个列可以包含1、2、3等的任何整数值,那么根据这个值,这些行应该转到table_1、table_2、table_3等。

如果事先不知道列中的不同值的数目,最好能解决这个问题,但是现在我们可以假设所有这些输出表都已经存在了。底线是,--不同值的数目,因此不同表的数量--足够高,以至于手动设置各个过滤器不是一种选择。

是否可以使用或类似的开放源码ETL工具(如Pentaho )来解决这个问题?

当然,我可以自己编写一个简单的脚本,但是我更喜欢使用适当的ETL工具,因为完整的ETL过程非常复杂。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-10-24 06:03:25

在PDI或Pentaho中,您可以通过分区来完成这一任务。(步骤IIRC上的右击选项) PDI中的分区正是针对这种问题而设计的。

票数 2
EN

Stack Overflow用户

发布于 2014-03-25 06:01:34

是的,可以根据单个列将数据拆分为不同的表,但为此需要动态创建表:-

tFileInputDelimited>tFlowtoIterate->tFixedFlowInput->和可以使用globalMap()获取列值,并使用相同的值将数据分离到不同的表。->和can在表名中使用globalMap(用于分隔数据)。

票数 1
EN

Stack Overflow用户

发布于 2012-10-22 19:56:58

我想到的第一个解决方案是使用复制器将当前行传输到三个过滤器,这些过滤器充当保护,并且只允许行通过给定列中的12或3。图片:http://i.imgur.com/FmvwU.png

但是您也可以动态地构建表名,如果这是您想要的,pic:http://i.imgur.com/8LR7Q.png

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13015048

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档