我有一个spark df,需要获取基本的描述性统计信息,如下例所示:

我的spark版本是3.0.1,我已经运行了以下代码:
df.describe().show()但它只输出数据,没有任何统计摘要。
发布于 2020-11-19 20:38:51
如果你的DataFrame是空的(我也在使用Spark 3.0.1),就会发生这种情况。
尝试下面的工作示例:
from pyspark.sql.functions import rand, randn
df = sqlContext.range(0, 10).withColumn('uniform', rand(seed=10)).withColumn('normal', randn(seed=27))
df.describe().show()

现在尝试使用空的DataFrame:
df = spark.createDataFrame(([],))
df.describe().show()

https://stackoverflow.com/questions/64881029
复制相似问题