我从我的主管那里得到了一个项目任务,他声称可以在HDInsight ( from )中使用Hive来查询两种不同的文件类型,然后从它们中提取数据。其中一个文件是.xls文件,另一个文件是.csv文件。我尝试了下面的示例代码来创建表、分隔、字段终止(我尝试了几个都没有成功)、文件类型(也不确定这里还应该使用什么)和目标位置。
CREATE EXTERNAL T
对于少数文件,POIFSFileSystem (inputStream)无法获取inputStream。有一个例外,它是:at org.apache.poi.poifs.storage.HeaderBlock.alertShortRead(HeaderBlock.java:226)
at org.apache.poi.poifs.storage.Hea