我正在寻找一种整洁的方法来找到每一列的最大值,并收集在地图中作为{col name:max value of col}。下面是我在一个玩具示例中所取得的进展。在我的完整数据中有数百列,所以手动转换每一列是不可行的。scala> import spark.implicits._
scala> impor
RDD已经做到了,但它并不是真正的可读性,所以当涉及到代码可读性时,这种方法会更好。 取这个初始的和结果的DF,包括开始的DF和我希望在执行.groupBy()之后获得的结果。toDF() 到目前为止,我尝试的是执行以下.groupBy... val resultDf = df Name .agg(
functions.mapException in thread "main" org.apache