"left join“需要在一个数据帧上使用"spark.sql.crossJoin.enabled=true”或调用"persist()“。SELECT * FROM LHS left join RHS on LHS.R = RHS.R
如何在没有"spark.sql.crossJoin.enabled=true“和持久化数据帧的情况下使”左连接“工作?下面的例外发生在Spark 2.3.3和2.4.4中。或者:使用交叉
在我们的一个Pyspark作业中,我们有一个场景,我们在一个大的数据帧和相对较小的数据帧之间进行连接,我相信spark正在使用广播连接,我们遇到了以下错误 org.apache.spark.SparkException(SQLExecution.scala:98)
at org.apache.spark.sql.execution.exchange.BroadcastExchangeExec$$anonfun':'-1‘设置为spark su