我有大约95个数据集成接口,用于从SAP ECC环境中提取和加载数据。每个数据集在单个表中“登陆”到Teradata中,随后被处理到一个更具结构化和键值的表中,以供下行使用。这会处理复制和增量更改等问题。
我的问题是每次有新的加载进入时,初始落地表都会被截断。如果落地数据集无法向前处理,它将被截断,并且在下一个加载到来时,新的数据集将替换落地中的数据集。这一切都不是我设计或开发的,但它造成了很多痛苦以及补救(bug)罚单。
我想提出一个解决方案,并想知道是否有可能不截断初始落地表,而是在新加载进入时为每个落地数据集创建一个新的分区。通过这种方式,我们可以完全避免丢失数据集。这在Teradata中是可能的吗?
我想补充的是,我们正在使用Informatica将SAP BW连接到Teradata,因为这对我们面临的困难程度有一定的影响。在这种情况下,Informatica并不是一个巨大的粉丝。
先感谢大家的帮助,帕特
发布于 2020-01-15 21:09:27
这个问题不能通过对登录表进行分区来解决。请注意,创建分区是为了通过将“相似”行组织为Amp来增强查询性能。
分区主索引(PPI)允许将行分配给AMP上的用户定义的数据分区,从而增强了基于主索引值的范围查询的性能。有关详细信息,请参阅数据库设计和SQL请求与事务处理。https://docs.teradata.com/reader/Fs1l1bqzqbnO0oVqjSVP5g/MMVfdnwiK91oXhkK53mN0Q
Teradata可以使用TTP Update Operator或Multiload在已填充的表上批量追加数据。
https://stackoverflow.com/questions/20385707
复制相似问题