文章/答案/技术大牛

发布

社区首页 >问答首页 >获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)

问获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)
EN

Stack Overflow用户

提问于 2020-05-03 09:19:05

回答 1查看 2.8K关注 0票数 1

我正试图根据以下数据框架- salesDF的收入对列“产品”进行排名。

salesDF=
+-------------+-------+---------+----------+-------+
|transactionID|Product| category|produtType|Revenue|
+-------------+-------+---------+----------+-------+
|          105| Lenova|   laptop|      high|  40000|
|          111| Lenova|   tablet|    medium|  20000|
|          103|   dell|   laptop|     medum|  25000|
|          107| iphone|cellPhone|     small|  70000|
|          113| lenovo|cellPhone|    medium|   8000|
|          108|     mi|cellPhone|     medum|  10000|

下面是iam，使用spark根据收入对每个产品进行排序

rankTheRevenue= salesDF.createTempView("Ranking_DF")
rankProduct= session.sql("select Product, Revenue, rank() over(partion by Product order by Revenue) as Rank_revenue from Ranking_DF")
rankProduct.show()

但我在跟踪错误

pyspark.sql.utils.ParseException: 
mismatched input '(' expecting {<EOF>, ',', 'CLUSTER', 'DISTRIBUTE', 'EXCEPT', 'FROM', 'GROUP', 'HAVING', 'INTERSECT', 'LATERAL', 'LIMIT', 'ORDER', 'MINUS', 'SORT', 'UNION', 'WHERE', 'WINDOW', '-'}(line 1, pos 36)

如果有人能帮我解决这类问题，我很感激

谢谢

pyspark

apache-spark-sql

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-05-04 02:02:51

在partition by子句处有一个类型的作为partion by。

试着：

rankTheRevenue= salesDF.createTempView("Ranking_DF")
rankProduct= session.sql("select Product, Revenue, rank() over(partition by Product order by Revenue) as Rank_revenue from Ranking_DF")
rankProduct.show()

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61572145

复制

相似问题

问获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)
EN