首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >greenplum中的增量加载

greenplum中的增量加载
EN

Stack Overflow用户
提问于 2017-07-27 03:01:49
回答 1查看 134关注 0票数 0

我在greenplum中有外部和内部表。外部表在hdfs中指向csv文件。Hdfs中的csv文件每小时加载一张表的完整数据。在greenplum的内部表中以增量方式加载数据的最佳方式是什么。

EN

回答 1

Stack Overflow用户

发布于 2017-10-20 20:22:36

在greenplum中创建维度表,它在这里存储之前加载的最后一个收银台,比如时间戳或任何数据点。

使用上面的维度表,你可以以这样的方式返回UDF,每隔一小时当一个新文件到达时,它会加载到stage/extrenal表中,然后用维度表中最后加载的参数,它将只挑选相关/新的记录进行进一步处理。

谢谢你,shobha

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45335378

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档