首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >描述性统计或汇总统计PySpark 3.0.1

描述性统计或汇总统计PySpark 3.0.1
EN

Stack Overflow用户
提问于 2020-11-18 02:17:41
回答 1查看 4.4K关注 0票数 0

我有一个spark df,需要获取基本的描述性统计信息,如下例所示:

我的spark版本是3.0.1,我已经运行了以下代码:

代码语言:javascript
复制
df.describe().show()

但它只输出数据,没有任何统计摘要。

EN

回答 1

Stack Overflow用户

发布于 2020-11-19 20:38:51

如果你的DataFrame是空的(我也在使用Spark 3.0.1),就会发生这种情况。

尝试下面的工作示例:

代码语言:javascript
复制
from pyspark.sql.functions import rand, randn

df = sqlContext.range(0, 10).withColumn('uniform', rand(seed=10)).withColumn('normal', randn(seed=27))
df.describe().show()

现在尝试使用空的DataFrame:

代码语言:javascript
复制
df = spark.createDataFrame(([],))
df.describe().show()

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64881029

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档