如何将记录追加到已有的分区Hive表中?例如,我有一个名为"ip_country“的现有外部表,而dataset是testdata1。如果数据集增长,比如我第二天的数据集是testdata1和testdata2,那么如何将新数据,即"testdata2“附加到"ip_country”配置单元表中。
发布于 2015-05-13 19:36:29
它可以通过几种方式来实现(完全取决于您的需求)
INSERT覆盖表分区[ tablename1 (partcol1=val1,partcol2=val2 ...) ]如果不存在]来自from_statement的select_statement1;
插入到表tablename1分区(partcol1=val1,partcol2=val2 ...)来自from_statement的select_statement1;
插入一次历史数据和增量数据(基于您选择的每日/每周/每两周的频率
https://stackoverflow.com/questions/30211878
复制相似问题