可以将原始SQL字符串转换为DataFrame。但是,是否也有可能采取相反的方法,即为(派生的)星火DataFrame的查询逻辑获取SQL表示?= a.groupBy($"foo").agg(count("*") as "occurrences").orderBy($"occurrences")
// Convert a SQLFRO
嗨,我是pyspark的新手。我没有用pyspark编写代码,所以我需要帮助来使用python在pyspark上运行sql查询。sql查询:
select a.id as nmitory_id, a.dscrptn as nmitory_desc, a.nm as terr_nm, a.pstn_typ
我需要在SparkSQL中传递参数。例如,我有以下查询作为Val时间戳=spark.sql("select timestamp from tablea "),现在,我有另一个查询要在where类Spark.sql中传递这个时间戳(s“select但是上面的查询返回不匹配的表达式错误。有没有人能提个解决方案
在PySpark SQL查询过程中,我面临一个特殊的或未知的连接问题。spark.sql("select *,rtrim(IncomeCat)+' '+IncomeCatDesc as trimcat from Dim_CMIncomeCat_handled").show()
在这个查询中,IncomeCat和IncomeCatDesc字段都保持字符串类型值,所以从逻辑上说,