我目前正在使用hql将数据从配置单元表卸载到文本文件中。因为它花费了太多的时间。我想去spark或pyspark.I。我是spark/ please的新手。你能帮我解决这个问题吗?我正在使用下面的查询来卸载 beeline --outputformat=dsv --silent=true - e 'select * from
我正在使用本地窗口,并试图用python上的以下代码加载XML文件,我遇到了这个错误,有人知道如何解决它吗?\spark-2.2.0-bin-hadoop2.7\python\pyspark\sql\readwriter.py in load(self, path, format, schema, **options= list:
C:\SPARK_HOME\spark-2.2.0-bin-hadoop2.7\python<