首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)

获取pyspark.sql.utils.ParseException:不匹配的输入“(”期望{<EOF>“)
EN

Stack Overflow用户
提问于 2020-05-03 09:19:05
回答 1查看 2.8K关注 0票数 1

我正试图根据以下数据框架- salesDF的收入对列“产品”进行排名。

代码语言:javascript
运行
复制
salesDF=
+-------------+-------+---------+----------+-------+
|transactionID|Product| category|produtType|Revenue|
+-------------+-------+---------+----------+-------+
|          105| Lenova|   laptop|      high|  40000|
|          111| Lenova|   tablet|    medium|  20000|
|          103|   dell|   laptop|     medum|  25000|
|          107| iphone|cellPhone|     small|  70000|
|          113| lenovo|cellPhone|    medium|   8000|
|          108|     mi|cellPhone|     medum|  10000|

下面是iam,使用spark根据收入对每个产品进行排序

代码语言:javascript
运行
复制
rankTheRevenue= salesDF.createTempView("Ranking_DF")
rankProduct= session.sql("select Product, Revenue, rank() over(partion by Product order by Revenue) as Rank_revenue from Ranking_DF")
rankProduct.show()

但我在跟踪错误

代码语言:javascript
运行
复制
pyspark.sql.utils.ParseException: 
mismatched input '(' expecting {<EOF>, ',', 'CLUSTER', 'DISTRIBUTE', 'EXCEPT', 'FROM', 'GROUP', 'HAVING', 'INTERSECT', 'LATERAL', 'LIMIT', 'ORDER', 'MINUS', 'SORT', 'UNION', 'WHERE', 'WINDOW', '-'}(line 1, pos 36)

如果有人能帮我解决这类问题,我很感激

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-05-04 02:02:51

partition by子句处有一个类型的作为partion by

试着:

代码语言:javascript
运行
复制
rankTheRevenue= salesDF.createTempView("Ranking_DF")
rankProduct= session.sql("select Product, Revenue, rank() over(partition by Product order by Revenue) as Rank_revenue from Ranking_DF")
rankProduct.show()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61572145

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档