使用简单的select * from table查询在Spark上运行Hive,运行平稳,但是在联接和和时,ApplicationMaster返回关联的火花容器的堆栈跟踪: at org.apache.hive.spark.client.rpc.RpcConfiguration<clinit>(RpcConfiguration.java
当您在蜂巢中创建一个表时:LOAD DATA INPATH <HDFS_file_location> INTO table managed_table;
因此,我知道这个命令接受HDFS中文件的内容,并创建它的MetaData表单并将其存储在MetaStore中(包括列类型、列名、它在HDFS中的位置等它实际上并没有将数据从HDFS移动到Hive中。