我有两个hive表,具有相同的列和数据类型等,我想将数据从一个表复制到不同集群中的另一个表。
hive或sqoop是否提供了一种简单的方法来实现这一点?
场景:
Table A in Cluster1
Table B in Cluster2
Append table A into Table B on Cluster 2 发布于 2013-10-15 03:16:20
实现这一点的一种便捷方法是使用蜂窝的功能。导出命令将表或分区的数据连同元数据一起导出到指定的输出位置。然后可以将此输出位置移动到不同的或配置单元实例,并使用Hadoop导入命令从那里导入。
发布于 2016-12-16 12:07:51
您也可以使用falcon进行数据复制。您还可以使用配置单元上下文,并用Java或Scala编写代码来复制数据。
发布于 2016-12-16 14:56:33
您可以使用Distcp命令在clusters.But之间复制数据,您必须先将表数据转换为文件,然后使用下面的command.Usage将文件复制到不同的集群:
$ hadoop distcp (src) (dest)在集群2中复制文件后,您可以将该文件加载到表中。您可以在以下链接中找到更多信息:http://hadoop.apache.org/docs/r1.2.1/distcp.html
https://stackoverflow.com/questions/19367270
复制相似问题