我正在尝试连接databricks上的两个配置单元表。"too much traffic in rush hour" 我需要通过"question_id“连接tab1和tab2,这样我就可以得到一个新的表 consumer_id question_id但是,我不确定如何使用嵌入的struct/array来分解数组。 谢谢
我对MetaStore的目的有点困惑。当您在蜂巢中创建一个表时:LOAD DATA INPATH <HDFS_file_location它实际上并没有将数据从HDFS移动到Hive中。
但是存储这个MetaData的目的是什么呢?例如,当我使用Spark连接到Hive时,MetaStore不包含HDFS