首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将新数据追加到已存在的配置单元表中

如何将新数据追加到已存在的配置单元表中
EN

Stack Overflow用户
提问于 2015-05-13 18:16:26
回答 1查看 32.6K关注 0票数 5

如何将记录追加到已有的分区Hive表中?例如,我有一个名为"ip_country“的现有外部表,而dataset是testdata1。如果数据集增长,比如我第二天的数据集是testdata1和testdata2,那么如何将新数据,即"testdata2“附加到"ip_country”配置单元表中。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-13 19:36:29

它可以通过几种方式来实现(完全取决于您的需求)

  1. 如果你不想覆盖分区中的现有记录(我的意思是你没有很大的历史数据,比如说10年的数据),那么插入覆盖可能是合适的。

INSERT覆盖表分区[ tablename1 (partcol1=val1,partcol2=val2 ...) ]如果不存在]来自from_statement的select_statement1;

  1. 如果您不关心分区中的重复项,那么Insert Into可能更合适(老实说,我不希望有重复的记录)。

插入到表tablename1分区(partcol1=val1,partcol2=val2 ...)来自from_statement的select_statement1;

  1. 如果您有历史记录数据和增量数据,则可以使用Insert Overwrite

插入一次历史数据和增量数据(基于您选择的每日/每周/每两周的频率

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30211878

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档